vuoi
o PayPal
tutte le volte che vuoi
R) che vive nell’universo condizionato
rispetto ad R, cioè stiamo parlando di
probabilità definite in uno spazio
probabilistico che è uno spazio
condizionato, invece di fare un doppio
condizionamento quindi scrivere i|n(t)=j|R
che non esiste nel mondo del
condizionamento perché non esiste il
condizionamento del condizionamento,
allora una volta entrati nella clausola del
condizionamento mettiamo assieme tutte
le condizionanti e n(t)=j, R è l’evento
congiunto ed è tutto ciò che condiziona
questa probabilità condizionata. Se
ipotizzassimo di dare per scontato di
muoverci nell’universo condizionato,
quindi cancellando R, abbiamo
un’espressione della probabilità totale del
tutto simile a quella che già conosciamo,
in realtà R non si ritira in disparte, noi
viviamo nell’universo condizionato rispetto
ad R quindi semplicemente lo inseriamo
come condizione.
Notiamo che nella quantità il
condizionamento non gioca alcun ruolo
perché mi sto chiedendo quale sia la
probabilità che il mio navigatore fosse nel
j-esimo sito al passo t se poi ha estratto R
in quel passo lì per poter andare avanti?
Ma notiamo che l’estrazione di R non ha
alcun legame particolare con la probabilità
di n(t)=j, cioè è indipendente, quindi
possiamo scrivere =P(n(t)=j)= ora
dobbiamo capire cosa vale P(n(t+1)=i|
n(t)=j, R) e questo si ottiene facilmente
ricordando che la scelta in questo caso è
di scegliere un arco in uscita in maniera
equiprobabile, quindi al denominatore
devo fare la somma di tutti gli archi in
uscita e al numeratore avrò 1 o 0 a
seconda che ci sia o meno un arco in
uscita perché in alcuni casi semplicemente
quando sono in j non ho alcuna possibilità
di arrivare in i quindi quelli sono termini
che non vanno considerati, avrò una
possibilità di andare da j in i quando L =1,
ji
quindi avremo:
Definiamo ora:
Matrice A t.c.
5. T
Il vettore colonna degli 1=[1, 1, …, 1]
6.
A questo punto si vede che =
a questo punto vogliamo passare da una
notazione scalare a una vettoriale quindi
scriveremo le equazioni per x1, x2, …, xn
e mettendole assieme otterremo
x(t+1)=A*x(t)+[(1-p)/N]*matrice degli 1
Si può ulteriormente semplificare
introducendo una matrice V fatta tutti di 1,
essa ha una proprietà t.c.
Quindi moltiplicando V per x ottengo il
vettore di tutti 1, questo è possibile
perché perché le sono le
probabilità al passo t di stare nei diversi
siti quindi se faccio la somma di tutti i siti
possibili per i che va da 1 ad N trovo
l’evento certo e la relativa probabilità vale
1. Quindi ora possiamo scrivere
x(t+1)=pAx(t)+ Vx(t)=(pA+ V)x(t)
quindi un’espressione molto semplice.
Osservazioni:
Il modello appena trovato appartiene
7. alla categoria delle catene di Markov
Si può dimostrare per tto le
8. ipotesi fatte
Nel nostro esempio
9. T , questo è il
vettore della probabilità di regime di
trovarsi nei 5 nodi, quindi mi dice dopo
molto tempo che funziona il mio
modello del random surfer, quindi da
molto tempo che il mio navigatore sul
web fa surf da una pagina all’altra, se
io chiudo gli occhi e li riapro ho una
probabilità del 17% di stare nel sito 1,
del 16% nel sito 2, del 32% nel sito 3 e
così via.
Il modello considerato è molto
semplificato tanto che ci verrebbe da
domandarci se realmente potrebbe servire
a qualcosa, un’idea esiste: si potrebbero
usare le probabilità di regime ( ) come
strumento per costruire una specie di
classifica tra le pagine web, quindi una
pagina web con un maggiore in qualche
nodo è una pagina più interessante perché
il significato di è quello di contenere le
probabilità di regime e quindi se una certa
pagina web ha un grande quindi per una
ragione o per un’altra è più facile che un
random surfer vada a finire lì dentro,
potrebbero esserci molte ragioni per cui
ciò accade, ad esempio possono essere
ragioni di tipo pubblicitario nel senso che
quella pagina è linkata da molte altre
pagine e nel mio errare sul web alla fine
continuo a tornare attraverso quel nodo.
Fare una classifica del web potrebbe
essere la base di un motore di ricerca, io
potrei in qualche modo raccogliere tutte le
pagine pertinenti alla ricerca che sto
facendo però poi, quando ho trovato
migliaia di pagine, resta il problema