Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
Valutazione del p (p-valore)
Se il p-valore è troppo piccolo, si rifiuta l'ipotesi; se è grande, si accetta l'ipotesi alternativa. L'ipotesi alternativa può essere:
- Semplice: si fissa un unico valore del parametro
- Composta: si fissano diversi valori possibili del parametro. È monodirezionale (una coda) quando prevede la direzione della differenza, essa corrisponde a valori positivi, è invece bidirezionale (due code) quando non prevede direzione.
Test sull'ipotesi nulla
La logica inversa dell'ipotesi non si verifica ma si falsifica. L'interesse riguarda l'ipotesi alternativa, ma essa non può essere direttamente verificata. L'esame delle evidenze a favore dell'ipotesi nulla fornisce un metodo indiretto di valutare le evidenze a favore dell'ipotesi alternativa. La scelta sulle due ipotesi è fondata sulla probabilità di ottenere per caso il risultato osservato nel campione.
nella condizione che l'ipotesi nulla sia vera. Quanto più tale probabilità è piccola, tanto più è improbabile che l'ipotesi nulla sia vera.
Occorre stabilire quanto siano forti le evidenze empiriche a sostegno dell'ipotesi nulla, se i dati del campione non forniscono una forte evidenza a favore dell'ipotesi nulla, allora possiamo rigettare l'ipotesi nulla e accettare l'ipotesi alternativa.
Statistica test:
- Si calcola la statistica test con i dati del campione
- Si stabilisce una probabilità (p-valore) alla statistica test
- Il p-valore viene determinato costruendo la distribuzione campionaria della statistica test
Per stabilire che la probabilità associata all'ipotesi nulla è bassa o alta, si stabiliscono dei limiti entro cui accetto l'ipotesi nulla, ed entro cui la rifiuto. Entra in gioco il concetto di livello di significatività (α) che definisce la regione di rifiuto di quella
La regione della distribuzione campionaria composta dai risultati possibili che hanno una probabilità molto bassa di verificarsi quando è vera l'ipotesi nulla. Definisce, inoltre, la regione di accettazione di quella regione della distribuzione campionaria composta dai risultati possibili che hanno una probabilità molto alta di verificarsi quando è vera che corrisponde a 1-α. Convenzionalmente per α si stabiliscono valori bassi, perché il livello di α equivale al rischio che si è disposti a correre nel prendere la decisione su .
- α = 0.05 -> rischio di sbagliare rifiutando , quando è vera = 5 volte su 1000
- α = 0.01 -> rischio di sbagliare rifiutando quando è vera = 1 volta su 1000
- α = 0.001 -> rischio di sbagliare rifiutando quando è vera = 1 volta su 10000
Se p è maggiore di α accetto e rifiuto , se è minore, il contrario.
a
13/04/2022Anziché lavorare in termini di aree, cioè confrontare il pi-valore con l'area, calcoliamo un valore che è detto critico che mi delimita la regione di accettazione dall'area di rifiuto.
Il valore critico dipende dal valore di α, perché lo si stabilisce, e se l'ipotesi è mono o bi direzionale, perché:
- se l'ipotesi è monodirezionale, α è posizionata su una sola coda della distribuzione, α
- se l'ipotesi è bidirezionale, è posizionata su due code 2α
Il valore critico si trova sulla tavola corrispondente all'area α, o se l'ipotesi è bidirezionale. 2z
Per prendere la decisione sull'ipotesi, si devono confrontare z e (p=area della curva critica associata a viene confrontata con l'area di rifiuto definita da α). Se il valore critico, in valore assoluto, è maggiore di z, anch'esso in valore assoluto, e quindi
L'area della curva associata all'ipotesi nulla è maggiore di α, allora si accetta ed è vera l'ipotesi nulla, nel caso contrario, è vera l'ipotesi alternativa.
Verifica dell'ipotesi di una popolazione con sigma non noto. Non conoscendo il sigma della popolazione si va a calcolare quello che si chiama errore standard stimato: si conoscono solo deviazione standard e campione, quindi, la procedura è quella di stimare l'errore standard attraverso i dati che si conoscono.
s^ = σ M √(n-1) - μM Ms
Dopo di che si va a trovare z, con la formula: =z √(M n-1) 20/04/2022
Distribuzione di probabilità t. Distribuzione di probabilità teorica, cioè un modello descritto attraverso funzioni matematiche, in base alle loro caratteristiche permettono di fare una stima di probabilità. Generalmente si usa con campioni piccoli (n < 30) ed ha le seguenti caratteristiche: - infinita, va da
+∞ a -∞, come la distribuzione di probabilità normale- simmetrica, come la distribuzione di probabilità normale- unimodale, ha media, mediana e moda che coincidono, come la distribuzione normale
Si differenzia dalla distribuzione normale nella forma, difatti ha una forma più schiacciata e questo comporta il fatto che le costanti che si usavano con la distribuzione normale (area a – una deviazione standard a + una deviazione standard = 68% circa) non possono più essere usate.
Varia in base al dato relativo all’n del campione, cioè all’ampiezza campionaria. Come riferimento a quella che è questa caratteristica che può variare si considerano i gradi di libertà.
Gradi di libertà fanno riferimento all’ampiezza del campione. Tanto più n diventa più grande, tanto più la nostra distribuzione tende alla
normale. La curva definisce una distribuzione di probabilità: la distribuzione di probabilità t, definita μM Mt=dall'indicatore: σ MIl test più utilizzato è il t test, anche più del test z, per due motivi:
- è molto più probabile trovarsi a lavorare con campioni piccoli, campioni in cui illimite è l'ampiezza
- spesso i parametri della popolazione non sono notiσNel caso in cui non sia noto (caso più frequente nella pratica) è corretto usare t. Per valori n >30 i valori di t e z praticamente coincidono, è indifferente, quindi, fare riferimento all'una o all'altradistribuzione. La formula per il calcolo di t e z con σ non noto è identica. 21/04/2022
Confronto fra gruppi.Quando facciamo il confronto tra gruppi, dobbiamo fare una distinzione rispetto alla tipologia dicampione, esistono, infatti:
- Campioni indipendenti (disegni tra soggetti) quando
indipendenti e ) e si calcola la differenza delle loro medie.
1 21 2 ¿ ¿µ σQuesta distribuzione è caratterizzata da una media ( e un errore standard (−M −MM M1 2 1 2√ 2 2σ σ=µ −µµ 1 2e = +σ−MM M M −MM1 2 1 2 n n1 2 1 2Verifica delle ipotesi:- Definizione dell’ipotesi( )=µ −µ =0H : µ µ0 1 2 1 2H : µ ≠ µ (bidirezionale)a 1 2> (monodirezionale)µ µ1 2- Scelta del test statisticoSe le varianze delle popolazioni sono note e i campioni sono entrambi più grandi di30, possiamo usare la distribuzione normale standardizzata( ) ( )−M − −μM μ1 2 1 2z= √ ( )−µ =0µma2 2σ σ 1 21 2+n n1 2se le varianze sono, invece, non note e i campioni sono entrambi più grandi di 30, sipossono utilizzare sia la distribuzione normale standardizzata che quella t Student,se i
campioni sono più piccoli di 30 si può usare la distribuzione t Student.( ) ( )−M − −μM μ1 2 1 2z= √ (l’errore standard è stimato)2 2s s1 2±1 −1n n1 2( ) ( )−M − −μM μ1 2 1 2t= √ ( ) ( )2 2+ +nn x s n x s n1 1 2 2 1 2∙+n −2n n x n1 2 1 2- Z test & Distribuzione normale: Fissare il livello di significatività α, quindi la regioneHdi rifiuto secondo α e (mono/bi-direzionale), successivamente il p valore e loaz critico (come nel caso di un solo campione).- t Student & distribuzione t Student: Fissare il livello di significatività α e calcolare il+n −2¿n Hgdl ( , in base a α, (mono/bi-direzionale) e gdl si delinea la1 2 1regione di rifiuto trovando t critico sulla Tavola26/04/2022Campioni dipendenti (disegni entro i soggetti).Quando sullo stesso gruppo, sullo stesso campione, abbiamo due misurazioni. Il tipo di disegnovieneDefinito pre-test e post-test, appunto perché c'è una rilevazione prima e una dopo. Si parla, però, di campioni dipendenti anche quando, pur non avendo stessi soggetti, si hanno persone diverse che però hanno un certo legame. Questo campione fa riferimento ad una diversa distribuzione campionaria: la distribuzione delle differenze. Rispetto a questa distribuzione i valori ottenuti attraverso le diff