Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
LE MISURE E LE PROBABILITÀ
Misurazione e Misura
• Misurazione: insieme di operazioni che portano alla determinazione del valore del
misurando, cioè della grandezza da misurare, inizia specificando il metodo e la procedura di
misurazione
• Misura: valore del misurando ottenuto in seguito ad una misurazione (l’unità di misura deve
sempre essere espressa)
• Valore vero: è quello che si otterrebbe con una misurazione perfetta (senza errori)
Metodi di misura
• Diretto e Indiretto
• Metodo di misurazione diretto: si definisce metodo diretto se la misura è ottenuta mediante
l’utilizzo di uno strumento atto alla misurazione della grandezza «X» del misurando.
• In questo caso avrò una grandezza omogenea a quella che voglio misurare che sarà scelta
come campione, convenzionalmente assunta dunque come unità di misura
• Metodo di misurazione indiretto: si definisce metodo di misura indiretto se il risultato della
misura è espresso in termini di valori di altre grandezze, essendo ovviamente nota la
relazione fra queste e il misurando.
L’errore
• L’errore è il risultato di una misurazione meno il valore vero del misurando
• Non essendo noto quest’ultimo al posto dell’errore si utilizza la stima dell’incertezza
• Gli errori possono avere numerose cause, dagli strumenti alle costanti utilizzate, alle
osservazioni ripetute in maniera non identica.
Probabilità
Il caso interviene nella variabilità degli individui ma anche nella scelta del campione
selezionato. La probabilità di un evento è l’espressione quantitativa della frequenza con cui
esso si verifica (frequenza relativa). La probabilità (Pr) che si verifichi un evento aleatorio A
è data dal rapporto tra il numero di casi favorevoli (quelli in cui A si verifica) ed il numero di
casi possibili (cioè il numero di volte che A può verificarsi). Da un punto di vista statistico, la
probabilità viene definita come la frequenza relativa di un evento, in cui i valori sono
compresi nell’intervallo [0-1].
Pr(A)= casi favorevoli/casi possibili
• Esempio: lanciando una moneta, abbiamo due eventi possibili, testa o croce. Se voglio
stimare la probabilità dell’evento testa, esso sarà pari a ½, ossia 0,5
• Qual è la probabilità che una carta da gioco estratta a caso da un mazzo da 52 sia un
asso?
Esempio differente
Facciamo un altro esempio: supponiamo che in un episodio di intossicazione alimentare si
siano verificati 48 casi su un totale di 192 soggetti che hanno ingerito l’alimento contaminato.
La probabilità di ammalarsi per un soggetto scelto a caso è 48/192 (0,25, 25%).
• Rispetto agli esempi precedenti in questo caso abbiamo trattato di una probabilità a
posteriori cioè valutata su un evento già accaduto.
Probabilità di eventi complessi
• Vi sono situazioni in cui occorre valutare la probabilità di eventi che si esprimono come
combinazioni specifiche (evento A e B) oppure come alternative specifiche (evento A o B)
• In questi casi si parla di eventi complessi
• Gli eventi complessi si gestiscono attraverso due regole di base:
• La regola della moltiplicazione
• La regola dell’addizione
Regola della moltiplicazione
• La regola si applica ad una combinazione di eventi
• Stabilisce che la probabilità che si verifichino contemporaneamente l’evento A e l’evento B
equivale al prodotto delle probabilità di ciascun evento
Pr(A e B) = Pr(A) * Pr (B)
Pr(A e B e c) = Pr(A) * Pr(B) * Pr (C)
• Questa regola vale solo se A e B sono indipendenti, cioè nel caso in cui il verificarsi di A
non influenzi il verificarsi di B e viceversa.
• Esempio: supponiamo di studiare la resistenza agli antibiotici
• In particolare il 70% dei ceppi di Enterococcus è resistente alla tetraciclina e il 30% alla
ciprofloxacina
• Si tratta di due antibiotici le cui resistenze sono probabilmente indipendenti
• Preso a caso un ceppo di enterococcus, c’è probabilità 0,7 che esso sia resistente alla
tetraciclina e 0,3 che sia resistente alla ciprofloxacina.
• La probabilità che il ceppo sia contemporaneamente resistente ai due antibiotici è 0,7 * 0,3
= 0,21, ossia 21%
La regola dell’addizione
• La regola dell’addizione si applica ad una alternativa di eventi: essa stabilisce che la
probabilità che si verifichi A oppure B oppure entrambi equivale alla somma della probabilità
dei singoli eventi
• E’ necessario considerare se i due eventi si escludono reciprocamente (ossia il verificarsi
di uno inibisce la possibilità del verificarsi dell’altro oppure no)
• Esempio: se si lancia un dado gli eventi « esce il 2» e «esce il 3» si
escludono a vicenda, il verificarsi di un evento esclude il verificarsi dell’altro
• Nel caso che i due eventi si escludano reciprocamente la regola è
Pr(A o B) = Pr(A) + Pr(B)
Il test statistico
• E’ una procedura di calcolo
• Permette di rifiutare un’ipotesi
• Input (dati, un campione)
• Output (un consuntivo, test statistico)
• Decisione: in base al consuntivo si rifiuta oppure non si rifiuta l’ipotesi
Frequenze percentuali e loro errore standard
• Frequenza assoluta: numero di volte in cui un dato avvenimento si manifesta
• Frequenza relativa: il quoziente tra il numero di prove in cui un dato evento si manifesta e
il numero di prove totale
• Frequenza percentuale: frequenza relativa per 100
Esempio:
• Frequenza assoluta numero di volte in cui un dato evento si manifesta numero nati
femmine = 252
• Frequenza relativa il quoziente tra il numero di prove in cui un dato evento si manifesta e il
numero totale di prove
• N nati femmine 252e totale nati 512. 252/512 = 0,492
• Frequenza percentuale frequenza relativa a 100 0,492*100 = 49,2%
Il test del chi quadro
• Un test di significatività statistica è lo strumento indispensabile nel confronto fra due gruppi
o popolazioni riguardo a un parametro
• Uno dei test più comuni è il chi quadrato e permette di confrontare due percentuali allo
scopo di verificare se la loro differenza è probabilmente dovuta al caso oppure no
• Se la differenza non è dovuta al caso si dice che essa è statisticamente significativa
• Lo scopo è quello di stabilire se le due percentuali osservate differiscono soltanto per
errore di campionamento casuale oppure se è lecito ritenere che vi sia una differenza
oggettiva tra i due fenomeni di cui queste due percentuali misurano la probabilità di
manifestazione
• In quest’ultimo caso si dice che la differenza è statisticamente significativa
• Inizialmente qualsiasi sia la differenza esistente tra le due percentuali da confrontare, si
avanza l’ipotesi 0 (o ipotesi nulla) che afferma semplicemente che la differenza osservata è
dovuta al caso
• Tale ipotesi può essere accettata o rifiutata sulla base di un appropriato test statistico
• Nel confronto di due percentuali o di due proporzioni il test appropriato è quello del chi
quadrato
• I dati usati devono avere scala nominale
• Il metodo è utilizzabile quando:
• Il valore contenuto in ogni cella è maggiore di 5
• Il numero totale di osservazioni è maggiore di 30
• In caso contrario occorre utilizzare il test di Fisher
Esempio
• Supponiamo di voler mettere a confronto l’efficacia nella terapia di una malattia un nuovo
antibiotico (X) con un antibiotico già in uso/approvato (Y)
• Intraprendiamo un test clinico su una popolazione rappresentata dai soggetti affetti dalla
malattia che si presentano in alcuni ambulatori ed ospedali in un determinato periodo di
tempo
• Durante la sperimentazione ogni soggetto viene assegnato a caso al gruppo dei trattati
con A oppure a quello dei trattati con B
• Otteniamo la seguente tabella
Per valutare che questa maggior efficacia non sia dovuta al caso si utilizza il test del chi
quadrato. Ammesso che non esistano differenze nell’efficacia dei due trattamenti, che
probabilità c’è di osservare (in uno studio di dimensioni simili a questo) differenze uguali o
superiori a quelle che abbiamo osservato?
• La risposta a questa domanda dipende da quanto i dati ottenuti si discostano dai dati che
sarebbe lecito attendersi se i trattamenti avessero la stessa efficacia e se i dati fossero
influenzati soltanto dalla variazione casuale
• I dati dimostrano che complessivamente il trattamento è risultato efficace nel 74,8% dei
casi (52+40=92 soggetti su 123 trattati)
• Applichiamo ora questa percentuale di successo (74,8%) a ciascuno dei due gruppi di
soggetti
• Il valore di 46 è stato ottenuto assumendo una percentuale di guarigione del 74,8% nei 62
soggetti trattati col farmaco X
• Analogamente ci si sarebbe aspettata la guarigione del 74,8% dei 61 soggetti trattati con Y
ossia 46 soggetti
• I valori nelle altre celle sono stati ottenuti per differenza
• Il valore del chi quadrato che quantifica la differenza tra il numero degli osservati e degli
attesi è la somma delle quattro celle A, B, C e D per ciascuna delle quali si calcola il valore
della frazione (n osservato – n atteso)^2 /numero atteso
• Il valore del chi quadrato è determinato dalla differenza fra i numeri osservati e i numeri
attesi nel caso in cui i due trattamenti avessero avuto lo stesso effetto,
• e possiede 5 gradi di libertà. • Se fissiamo l'errore tollerato al 5% (α = 0,05) e diamo uno
sguardo alle tavole della distribuzione chi quadrato con 5 gradi di libertà dobbiamo rifiutare
l'ipotesi nulla con valori della statistica test superiori a 11,07.
• La nostra statistica test è uguale a 12,616 e pertanto dobbiamo respingere l'ipotesi nulla:
ciò vuol dire che il dado non è equilibrato.
• Il test di chi quadrato funziona quando nessun valore si presenta con una frequenza
inferiore a 5. Se ciò accade è meglio utilizzare altri test sulle frequenze, come il test esatto di
Fisher.
Performance diagnostica
La performance di un’indagine diagnostica corrisponde complessivamente al suo grado di
accuratezza, ovvero alla capacità di identificare come positivi all’indagine i soggetti affetti da
una data malattia e come negativi all’indagine i soggetti che, invece, non ne sono affetti.
Sono classicamente definiti come indici di performance diagnostica qu