Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
Precisione della stima della media
Per ciascuna stima della media campionaria, c'è una probabilità del 95% che si trovi all'interno dell'intervallo 10.149 e 11.851, cioè all'interno dell'intervallo di confidenza per il 95% dell'intera popolazione di medie campionarie.
Per il 95% di tutti i possibili valori di μ, conoscendo l'errore standard (SE) della popolazione, è possibile stimare per un singolo campione della popolazione (cioè una singola stima di μ) l'intervallo che ha una probabilità del 95% di includere la vera media.
Esempio, intervallo di confidenza di medie campionarie:
Osservazione: alcune lucertole sono più grandi di quelle che si trovano sulla Terra
Modello: le lucertole sono più grandi perché provengono da Marte
Ipotesi: la taglia media delle lucertole marziane è maggiore di quella attesa per un campione di lucertole terrestri
Ipotesi nulla: la
taglia media delle lucertole marziane è ≤ della taglia delle lucertole terrestri
Lucertole terrestri: μ = 300; σ² = 3000 ; lucertole marziane: = 360mm; nX́ = 595% intervallo di confidenza: n=Il 95% di tutti i possibili campioni di lucertole (con 5) hanno una lunghezza media tra 252 e 348.
Considerando l'intervallo di confidenza rifiutiamo l'ipotesi nulla: le lucertole di 360 mm hanno una bassa probabilità di essere terrestri.
Problema: l'applicazione della teoria sugli intervalli di confidenza è limitata dal fatto che presuppone la conoscenza della varianza σ², che invece generalmente noi non conosciamo. La soluzione a questo problema è data dalla distribuzione t di Student (Gosset, 1908).
t7. DISTRIBUZIONE DI STUDENT
La soluzione al problema scritto sopra consta della determinazione della frequenza di distribuzione di un numero t da utilizzare al posto di 1,96 (o ad altri valori della distribuzione normale
standard) quando la varianza non è nota, ma stimata. Si utilizza la distribuzione di frequenza di stime campionarie della varianza, calcolate per differenti taglie del campione (gradi di libertà).
Gradi di libertà = n-1 (con n = numero di repliche o numero di osservazioni)
All'aumentare di n, S fornisce una stima più precisa di σ².
In maniera analoga a quanto visto per la distribuzione normale standard (la distribuzione è stata tabulata (si conosce l'area sotto alla curva) ed è possibile individuare dei valori critici all'interno dei quali si trova una certa percentuale dell'intera distribuzione.
La distribuzione di è influenzata dalla taglia del campione: maggiore è la taglia del campione (n) e più vicina sarà la stima della varianza al valore reale (parametro di locazione) nella popolazione.
Quando la taglia del campione è molto grande (tende ad infinito), S stima
perfettamente σ et Z.la distribuzione di è uguale alla distribuzioneIn altre parole quando la taglia del campione è piccola si ha un ‘allargamento’ ed un‘appiattimento’ della curva.Per valori grandi di n, la statistica t segue una distribuzione campionaria prossima a quella diZ, cioé una distribuzione normale con μ=0 e σ=1:Esempio , distribuzione t di Student:Si ha un campione di 15 individui di una specie di lucertola. Dal campione, posso stimare la media e la varianza della lunghezza. tDa un solo campione è possibile valutare un intervallo compreso tra due valori di Z)(in maniera analoga a quanto visto per che ha una probabilità del 95% diμcontenere il valore medio della distribuzione di frequenza della variabile chestiamo misurando e che noi, generalmente, non possiamo conoscere in quanto è unparametro.Campionamento e stima della media di una variabile:Accuratezza e precisione sono in
funzione di 3 elementi:
-
Probabilità utilizzata per costruire l'intervallo di confidenza (influenza l'accuratezza): incrementando la probabilità utilizzata per costruire l'intervallo di confidenza (es: da 95% a 99%) ne aumenta l'ampiezza. Questo aumenta la probabilità che la media parametrica sia contenuta nell'intervallo di confidenza, ma ne diminuisce l'accuratezza: un intervallo molto ampio è poco informativo riguardo a dove si collochi la media parametrica.
-
Taglia del campione (n) (influenza accuratezza e precisione): la precisione dell'estima della media aumenta all'aumentare di n. μ = e σ = 2. Supponiamo di campionare da una distribuzione di frequenza con 100 1200 per 30 volte per ciascuna di 5 differenti taglie del campione (riportate sull'asse x). L'errore standard, per motivi matematici al denominatore, diminuisce all'aumentare di (n) della taglia del campione.
Dal grafico a, è evidente
variabile. La varianza della popolazione (σ²) influenza l'accuratezza e la precisione della stima della media. Un singolo campione fornisce una stima più precisa della media per una popolazione con bassa varianza rispetto a una popolazione con alta varianza. La varianza è un parametro intrinseco della popolazione che non può essere controllato dallo sperimentatore. I grafici mostrano la distribuzione delle medie campionarie (200 medie ciascuna calcolata con un campione di taglia n = 20) da popolazioni con la stessa media (μ = 100), ma con varianze diverse. Passando da a si vede che la distribuzione di frequenza delle medie diventa più ampia. Quindi, un singolo campione della stessa taglia fornisce una stima della media più precisa per una popolazione con bassa varianza rispetto a una popolazione molto variabile.variabile.Descrizione del campionamento:Parametri comunemente stimati in studi ecologici e statistiche campionarie (X è il valore dell'i-esimo campione ed n è il numero totale di campioni):
t8. -TEST e CONFRONTO TRA DUE POPOLAZIONI:
Test di ipotesi nulla e intervallo di confidenza t-test:
L'intervallo di confidenza può essere usato per il test di ipotesi nulla: con dei passaggi, si conclude che un valore osservato di ( ) ha una probabilità del 95% di trovarsi all'interno dell'intervallo definito dai valori superiore ed inferiore di che sono noti in quanto tabulati. t > t
Possiamo quindi testare un'ipotesi nulla: questa sarà rifiutata quando il valore di è 0.05 < -to .0.05
Esempio, t-test:
Vogliamo testare l'ipotesi che il peso medio di uova per nido di una specie di uccello appartenente ad una certa popolazione sia uguale a quello osservato in popolazione fuori
Dall'Europa. Mediante un campione di 14 nidi possiamo stimare il peso medio e la varianza.
Dalla tavola della distribuzione della statistica t vediamo che i valori inferiore e superiore di con 13 gradi di libertà (corrispondenti a n-1 gradi di libertà) sono ±0.052.16. t Con i dati ottenuti dal campionamento possiamo calcolare un che in questo caso obs- tha un valore minore del . Rifiutiamo quindi l'ipotesi nulla e concludiamo che il 0.05 peso medio di uova per nido della popolazione in esame è differente da quello di altre popolazioni extra-Europee.
Esempio, t-test: μ)Sappiamo che la densità media di insetti in aree di controllo ha una media ( = 8 . Vogliamo valutare gli effetti di un insetticida in fase di sperimentazione. Si quantifica la densità degli insetti in 9 quadrati (n = 9) all'interno dell'area trattata con insetticida (un solo quadrato non fornirebbe una stima rappresentativa della distribuzione
di frequenza della densità media di insetti in quest'area). I dati ci forniscono una media ed una varianza con i quali possiamo calcolare un valore di t. La tavola della statistica t (ad una coda) ci indica che i valori critici che separano il 2.5% della distribuzione in ciascuna coda (superiore ed inferiore), con 8 gradi di libertà, è uguale a 2.306. Il valore di t si trova all'esterno dei valori critici di t e, più precisamente nella coda inferiore. Per questo motivo, rifiutiamo l'ipotesi nulla e concludiamo che la densità degli insetti in aree trattate è differente (minore) da quella di aree non trattate (controlli). Comparazione della media di due popolazioni: Comparazione Prima-Dopo: operando una comparazione di questo tipo otteniamo dei risultati di difficile interpretazione in seguito all'intervento di altri fattori, quindi esperimenti di tipo prima-dopo sono spesso confusi. Esempio, popolazione prima vs.popolazione dopo:
Osservazione: la sopravvivenza di una specie di patella diminuisce durante l'estate
Modello: la sopravvivenza diminuisce a causa di scarsa disponibilità di cibo
Ipotesi: il peso delle patelle diminuisce durante l'estate: μ > μ
inizio fine
Ipotesi nulla: il peso delle patelle aumenta o non cambia durante l'estate: μ ≤ μ fine
Utilizzando la differenza delle medie iniziali e finali (μ =μ ) si riconduce il
inizio-fine dtest ad una singola "popolazione".
Quale è il valore critico? T critico = 2,16
Avendo un probabilità inferiore a 0,05 rifiutiamo l'ipotesi nulla.
Comparazione Trattamento-Controllo:
Esempio, popolazione trattamento vs popolazione controllo:
Densità degli insetti in un'area trattata con un insetticida in fase di sperimentazione e in un'area di controllo.
Ipotesi nulla: μ = μ μ - μ = 0 trattamento controllo
trattamento controlloUtilizzando la differenza delle medie del trattamento e del controllo (μ trattamento-=μ ) si riconduce il test ad una singola “popolazione”.controllo dGradi di libertà = (n + n -2) trattamento controllo9. POTENZA DI UN TEST STATISTICO:Problema: nel momento in cui decidiamo di accettare o rifiutare l’ipotesi nulla (H ) possiamo0distinguere 4 ipotetici scenari:se H è vera: 0 prendiamo una decisione corretta quando la accettiamo;o commettiamo un errore se la rifiutiamo, questo errore è detto di tipo I (α) (0.05;o sebbene in maniera arbitraria, è controllato dallo sperimentatore) (vedi alla fi