Anteprima
Vedrai una selezione di 4 pagine su 12
Random surfer model Pag. 1 Random surfer model Pag. 2
Anteprima di 4 pagg. su 12.
Scarica il documento per vederlo tutto.
Random surfer model Pag. 6
Anteprima di 4 pagg. su 12.
Scarica il documento per vederlo tutto.
Random surfer model Pag. 11
1 su 12
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

R) che vive nell’universo condizionato

rispetto ad R, cioè stiamo parlando di

probabilità definite in uno spazio

probabilistico che è uno spazio

condizionato, invece di fare un doppio

condizionamento quindi scrivere i|n(t)=j|R

che non esiste nel mondo del

condizionamento perché non esiste il

condizionamento del condizionamento,

allora una volta entrati nella clausola del

condizionamento mettiamo assieme tutte

le condizionanti e n(t)=j, R è l’evento

congiunto ed è tutto ciò che condiziona

questa probabilità condizionata. Se

ipotizzassimo di dare per scontato di

muoverci nell’universo condizionato,

quindi cancellando R, abbiamo

un’espressione della probabilità totale del

tutto simile a quella che già conosciamo,

in realtà R non si ritira in disparte, noi

viviamo nell’universo condizionato rispetto

ad R quindi semplicemente lo inseriamo

come condizione.

Notiamo che nella quantità il

condizionamento non gioca alcun ruolo

perché mi sto chiedendo quale sia la

probabilità che il mio navigatore fosse nel

j-esimo sito al passo t se poi ha estratto R

in quel passo lì per poter andare avanti?

Ma notiamo che l’estrazione di R non ha

alcun legame particolare con la probabilità

di n(t)=j, cioè è indipendente, quindi

possiamo scrivere =P(n(t)=j)= ora

dobbiamo capire cosa vale P(n(t+1)=i|

n(t)=j, R) e questo si ottiene facilmente

ricordando che la scelta in questo caso è

di scegliere un arco in uscita in maniera

equiprobabile, quindi al denominatore

devo fare la somma di tutti gli archi in

uscita e al numeratore avrò 1 o 0 a

seconda che ci sia o meno un arco in

uscita perché in alcuni casi semplicemente

quando sono in j non ho alcuna possibilità

di arrivare in i quindi quelli sono termini

che non vanno considerati, avrò una

possibilità di andare da j in i quando L =1,

ji

quindi avremo:

Definiamo ora:

Matrice A t.c.

5. T

Il vettore colonna degli 1=[1, 1, …, 1]

6.

A questo punto si vede che =

a questo punto vogliamo passare da una

notazione scalare a una vettoriale quindi

scriveremo le equazioni per x1, x2, …, xn

e mettendole assieme otterremo

x(t+1)=A*x(t)+[(1-p)/N]*matrice degli 1

Si può ulteriormente semplificare

introducendo una matrice V fatta tutti di 1,

essa ha una proprietà t.c.

Quindi moltiplicando V per x ottengo il

vettore di tutti 1, questo è possibile

perché perché le sono le

probabilità al passo t di stare nei diversi

siti quindi se faccio la somma di tutti i siti

possibili per i che va da 1 ad N trovo

l’evento certo e la relativa probabilità vale

1. Quindi ora possiamo scrivere

x(t+1)=pAx(t)+ Vx(t)=(pA+ V)x(t)

quindi un’espressione molto semplice.

Osservazioni:

Il modello appena trovato appartiene

7. alla categoria delle catene di Markov

Si può dimostrare per tto le

8. ipotesi fatte

Nel nostro esempio

9. T , questo è il

vettore della probabilità di regime di

trovarsi nei 5 nodi, quindi mi dice dopo

molto tempo che funziona il mio

modello del random surfer, quindi da

molto tempo che il mio navigatore sul

web fa surf da una pagina all’altra, se

io chiudo gli occhi e li riapro ho una

probabilità del 17% di stare nel sito 1,

del 16% nel sito 2, del 32% nel sito 3 e

così via.

Il modello considerato è molto

semplificato tanto che ci verrebbe da

domandarci se realmente potrebbe servire

a qualcosa, un’idea esiste: si potrebbero

usare le probabilità di regime ( ) come

strumento per costruire una specie di

classifica tra le pagine web, quindi una

pagina web con un maggiore in qualche

nodo è una pagina più interessante perché

il significato di è quello di contenere le

probabilità di regime e quindi se una certa

pagina web ha un grande quindi per una

ragione o per un’altra è più facile che un

random surfer vada a finire lì dentro,

potrebbero esserci molte ragioni per cui

ciò accade, ad esempio possono essere

ragioni di tipo pubblicitario nel senso che

quella pagina è linkata da molte altre

pagine e nel mio errare sul web alla fine

continuo a tornare attraverso quel nodo.

Fare una classifica del web potrebbe

essere la base di un motore di ricerca, io

potrei in qualche modo raccogliere tutte le

pagine pertinenti alla ricerca che sto

facendo però poi, quando ho trovato

migliaia di pagine, resta il problema

Dettagli
Publisher
A.A. 2023-2024
12 pagine
SSD Scienze economiche e statistiche SECS-S/01 Statistica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher ab502 di informazioni apprese con la frequenza delle lezioni di Identificazione dei modelli e analisi dei dati e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Pavia o del prof De Nicolao Giuseppe.