Tesi di Biostatistica

La tesina tratta sinteticamente vari argomenti di statistica tra cui i concetti di media, mediana, moda e varianza, la distribuzione di Bernoulli, di Poisson e di Gauss, la teoria dei campioni …

Esame Istituzioni di Matematiche e Statistica

Facoltà Scienze matematiche fisiche e naturali

Dal corso del Prof. Rao Giuseppe

Università Università degli Studi di Palermo

Publisher nicolamilano91

A.A. 2010-2011

37 pagine

1 download

Appunto

Vota 3,5 / 5 (2)

Scarica

Estratto del documento

P⋅ B A

∩  1

P⋅ B A

/ = =

1 ∑

P⋅ A P⋅ B A B

⋅P⋅ / 

1 1

P⋅ A∩ B 

P⋅ A B se sono indipendenti

/ = P⋅ B 

Ed è la probabilità dell'evento A una volta che si verifica l'evento B. (L'area che ha A su B)

P⋅ A∩ B 

P⋅ B A La probabiltà dell ' evento una voltache si verifica l ' evento B

/ = P⋅ A

ESERCIZIO

In un esperimento di laboratorio in cui si deve verificare una certa ipotesi teorica, si è trovato un

risultato che pare confutare tale ipotesi. Tutto ciò si può far risalire a due cause: ci sono degli errori

di misurazione o di calcolo dovuti ad errori umani; ci sono delle ipotesi teoriche sbagliate.

Indichiamo con A l'evento: “sono presenti errori di procedura”; A : “ ci sono ipotesi errate”;

1 2

B:”l'esperimento è fallito”.

Affidabilità degli strumenti= 85℅; affidabilità degli sperimentatori= 70℅; eventi A e A

1 2

equiprobabili e quindi:

P⋅ A ; P⋅ A ; P⋅ B A ; P⋅ B A

=0,5 =0,5 / =0,85 / =0,7

1 2 1 2

P⋅ A B 0,7⋅0,5

/ =0,7⋅0,5 /0,85⋅0,5− −0,4516

La probabilità che che la causa del fallimento dell'esperimento sia dovuta a ipotesi errate è del 45℅

PROBLEMI

Dato un individuo malato quale è la probabilità che risulti positivo al test?

Dato un individuo sano quale è la probabilità che risulti negativo al test?

Dato un test con esito positivo quale è la probabilità che l'individuo sia malato?

Dato un testo con esito negativo quale è la probabilità che l'individuo sia sano?

Indichiamo con:

M = evento : malattia presente

S = evento: malattia assente

T = evento : test positivo

T = evento: test negativo

Possiamo dare le seguenti definizioni allora: +

Sensibilità di un test = La probabilità di risultare positivo una volta che si è malati: P(T /M)

Specificità di un test = La probabilità di essere negativo al test una volta malati: P(T /S)

P⋅T M

∩ 

P(T /M) = P⋅ M 

P⋅T S

/ 

P(T /S) = P⋅ S 

ESERCIZIO

P(T /M) = 0,90 specificità

P(T /S) = 0,95 sensibilità

DOBBIAMO DETERMINARE LA POSSIBILITA' DI ESSERE MALATI E RISULTI POSITIVA

ALLA TESI

P⋅T M

∩  P⋅T P⋅T M

+ +

P(M/T ) = = P(M/T ) = / ⋅P⋅M 

P⋅ M 

INVECE LA PROBABILITA' DI ESSERE STATI POSITIVI AL TEST PRIMA DI SAPERE SE SI

E' MALATI P⋅ M P⋅T M M

∩T  / ⋅P⋅ 

P(T /M) = = P(M/T) =

P⋅ M P⋅T

 

P⋅M = =0,001

Evento malattia presente 1000

999

P⋅S = =0,999

Evento malattia assente 1000

Adesso troviamo il valore predittivo del test positivo

sensibilità⋅prevalenza della malattia

P(M/T ) = sensibilità⋅prevalenza prevalenza⋅1− specificità

1− 

0,95⋅0,001 0,00095

= =0,0094≃0,01

P(M/T ) = 0,95⋅0,0011−0,001⋅1− 0,9 0,10085

Screening diagnostico teorema di bayes: esercizi

PROBLEMA

Si consideri un test destinato a rivelare la presenza nel siero di anticorpi anti-HIV. Si assuma che

che questo test abbia una sensibilità del 100℅ (il test quindi è positivo nel 100℅ dei malati). Si

assuma che questo test abbia una specificità del 99,7℅ (il test quindi è negativo nel 99,7℅ dei

soggetti sani). Si sa che la prevalenza dell'infezione da HIV è del 3 per 1000 (in una popolazione di

1000 3 soggetti sono affetti da HIV).

Qual'è il valore predittivo del test positivo?

Supponendo di fare un test su una popolazione di 1000 individui 3 sono positivi agli anticorpi anti-

HIV (i veri positivi), 6 sono positivi al test ma 3 sono falsi positivi, abbiamo la prevalenza del 3 per

1000.

P(T /M) = 1 sensibilità 100℅

P(T /M) = 99,7℅ specificità

P(M) = 3/1000 = 0,003

sensibilità⋅prevalenza della malattia

P(M/T ) = sensibilità⋅prevalenza prevalenza⋅1− specificità

1− 

1⋅0,003 0,003 valore predittivo del test positivo

= =0,501

0,997 0,005991

1⋅0,003⋅1−0,003⋅1−

PROBLEMA

Un marcatore tumorale ha le seguenti caratteristiche: (1) è positivo in 95 su 100 pazienti con il

cancro; (2) è negativo in 95 su 100 pazienti senza il cancro non ancora diagnosticato del tipo che il

marcatore tumorale in questione rileva. Se il test è prescritto a un paziente selezionato casualmente

in questa popolazione e l'esito è positivo, quale è la probabilità che il paziente abbia realmente il

cancro?

Prima d tutto analizziamo le 3 affermazioni:

(1) è positivo in 95 su 100 pazienti con il cancro, significa che il test ha una sensibilità del 95℅

(2) è negativo in 95 su 100 pazienti senza cancro, significa che il test ha una specificità del 95℅

(3) in media, 5 persone su una popolazione di 1000 hanno un cancro non ancora diagnosticato

del tipo che il marcatore tumorale in questione rileva, significa che la prevalenza della

malattia è del 5 per 1000

P(T /M) = 95℅ sensibilità

P(T /S) = 95℅ specificità

P(M) = 5/1000 = 0,005

Adessp dobbiamo trovare il valore predittivo del test positivo e il valore predittivo del test

negativo. sensibilità⋅prevalenza della malattia

P(M/T ) = specificità⋅prevalenza prevalenza⋅1− specificità

1− 

0,95⋅0,005 0,00475 valore predittivo del test positivo

= =0,087=8,7

0,95⋅0,0051−0,005 0,95 0,004750,04975

⋅1−

sensibilità⋅1− prevalenza 

- -

P(M / T ) = specificità⋅1− prevalenza prevalenza⋅1 specificità

 − 

0,95⋅1−0,005 0,94525

 0,997=99,97 valore predittivo del test negativo

= =

0,95⋅1− 0,0051−0,095 0,9455

⋅0,005

SENSibilità E SPEcificità DI UN TEST

La sensibilità e la specificità sono due misure che vengono impiegate per valutare la capacità di

indovinare, fra gli individui di una popolazione, quelli provvisti del “carattere” ricercato e quelli

che invece ne sono privi. In pratica, per i nostri scopi, il “carattere” è rappresentato quasi sempre

dalla malattia dall'infezione.

SENSIBILITA'

La sensibilità è la capacità di identificare correttamente gli individui ammalati. La sensibilità

risponde alla domanda: “Fra gli individui malati, quanti risultano test-positivi?”. In termini di

probabilità, la sensibilità è la probabilità che un individuo ammalato sia positivo al test. Possiamo

anche dire che la sensibilità è la proporzione di individui ammalati che risultano positivi al test.

SPECIFICITA'

La specificità è la capacità di identificare correttamente gli individui sani. La specificità risponde

alla domando: “Fra gli individui sani, quanti risultano test-negativi?”. In termini di probabilità, la

specificità è la probabilità che un individuo sano sia negativo al test. Possiamo anche dire che la

specificità è la proporzione di individui ammalati che risultano negativi al test.

Per valutare un test è necessario conoscere Sensibilità e Specificità. Per valutare un paziente è

necessario conoscere il VALORE PREDITTIVO POSITIVO se positivo al test e il VALORE

PREDITTIVO NEGATIVO se negativo al test.

Teorema di bernoulli

Il teorema di Bernoulli descrive il comportamento della media di una sequenza n variabili casuali

indipendenti caratterizzate dalla stessa distribuzione di probabilità (n misure della stessa grandezza,

n lanci della stessa moneta, ecc...) al tendere ad infinito della numerosità della della sequenza stessa

(n). In altre parole, grazie alla legge dei grandi numeri, possiamo fidarci che la media che

calcoliamo a partire da un numero sufficiente di campioni sia sufficientemente vicino alla media

vera.

In termini generici, per legge dei grandi numeri si può dire:

che la media della sequenza è un'approssimazione, che migliora al crescere di n, della media della

distribuzione; e che, viceversa, si può prevedere che sequenze siffatte mostreranno una media tanto

più spesso e tanto più precisamente prossima alla media della distribuzione n quanto più grande

sarà n. Un caso particolare di applicazione della legge dei grandi numeri è la previsione

probabilistica della proporzione di successi in una sequenza di realizzazioni indipendenti di un

evento E: per n che tende a infinito, la proporzione di successi converge alla probabilità di E.

ESEMPIO

Supponiamo di avere un evento (come il fatto che lanciando un dado esca il sei) con probabilità

sconosciuta p.

Eseguendo n lanci consecutivi otteniamo una stima della probabilità di fare sei con quel dado data

da: x x x

 ...

1 2 n



X = n

dove la X della somma rappresenta l'esito dei lanci e valgono uno se in quel lancio è uscito il sei, o

zero se uscito un altro numero. La legge dei grandi numeri afferma semplicemente che, tante più

prove usciamo per calcolare la stima, tanto più questa sarà vicina, probabilmente, alla probabilità

reale dell'evento p.

Se la stima X(n) che calcoleremo sarà molto vicina a un sesto, che è la probabilità teorica che esca

il sei per un dado perfetto, potremmo essere ragionevolmente certi che il dado in questione non è

polarizzato per sei. DISTRIBUZIONE DI BERNOULLI

Una distribuzione di variabile casuale discreta molto utilizzata è quella binomiale.

Questa distribuzione ha origine da un processo noto come esperimento bernoulliano, così chiamato

in onore del matematico J. Bernoulli. Se si considera un processo o esperimento, chiamato anche

prova, i cui possibili risultati sono costituiti da due eventi mutuamente esclusivi come vivo o morto,

malato o sano, a termine o prematuro, la prova è chiamata di Bernoulli.

Se eseguiamo n prove ripetute indipendenti, il numero delle volte in cu

Anteprima

Vedrai una selezione di 9 pagine su 37