Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
GENERALIZZANDO:
Quando testiamo un'ipotesi, possiamo commettere due tipi di errori:
- Errore di Tipo I (α): Ri utare H0 quando è vera (falso positivo).
- Errore di Tipo II (β): Accettare H0 quando è falsa (falso negativo).
Decisione \ Realtà H Vera H Falsa
0 0
Accettare H Decisione corretta Errore di Tipo II (β)
0
Ri utare H Errore di Tipo I (α) Decisione corretta
0
α è detto LIVELLO DI SIGNIFICATIVITA’ e solitamente è ssato molto piccolo (0.05 o anche 0.01)
perchè è ritenuto più grave come errore.
Bisogna dire che se si riduce α, β aumenta e viceversa.
1 - β è la POTENZA DEL TEST, cioè la probabilità di ri utare correttamente l’ipotesi nulla.
Come già detto, poiché l’errore di tipo 1 (H vera, ma ri utata) è considerato più importante,
0
quindi si preferisce tenere sotto controllo il corrispondente rischio.
Ciò che si fa quindi, di solito, è ssare anticipatamente il valore di α, quindi l’errore massimo che
sei disposto a rischiare di fare nel ri utare H , e poi si cerca di ridurre β, cioè il rischio dell’errore di
0
tipo 2.
—> si controlla α e si cerca di minimizzare β.
β dipende dalla dimensione campionaria —> maggiore dimensione campionaria —> maggiori
è meno probabile sbagliare accettando H
informazioni —> il test statistico è più forte —> 0
quando è falsa —> β più piccolo.
Non si può sempre controllare β, ma si può ridurre aumentando il numero di osservazioni, quindi
usando campioni più grandi.
Problema: Dobbiamo trovare un modo per de nire la regione critica (dove ri utiamo H ) e la
0
regione di accettazione (dove accettiamo H .
0
Soluzione proposta: Usare il Lemma di Neyman-Pearson.
L'idea è: ssiamo α (probabilità di ri utare H quando è vera) e costruiamo la regione critica di
0
conseguenza.
Caso speci co: Media di una popolazione normale, con varianza incognita (il caso più comune
nella realtà).
Consideriamo due ipotesi semplici (entrambe speci cano un valore esatto):
H : μ = μ (es.: fatturato medio = 3)
0 0
H : μ = μ μ > μ
(es.: fatturato medio = 3.5), con
1 1 1 0
Esempio concreto: Un'azienda vuole aprire negozi. Campione di 400 negozi, fatturato per mq
segue una distribuzione normale. Si testa se il fatturato medio è 3 o 3.5 (migliaia di €).
X̄
Usiamo la media campionaria come indicatore. Pagina 11 di 70
fi fi fi fi fi fi fi fi fi fi fi fi fi fi fi fi
μ > μ
- Se 1 0 X̄
Valori alti di supportano H 1
X̄
Valori bassi di supportano H 0
x̄*
- Obiettivo: Trovare una soglia (valore critico) tale che:
X̄ ≥ x̄* →
Se ri utiamo H0
X̄ < x̄* →
Se accettiamo H 0
Come trovare la soglia?
Standardizziamo la statistica:
Poiché la varianza è incognita, usiamo la distribuzione t di Student:
X̄ − μ 0
T = ∼ t
n−1
s / n
Colleghiamo ad α:
Per de nizione: | |
α = P( H H ) = P( X̄ ≥ x̄* H )
ri utare vera
0 0 0
Sostituendo:
( )
x̄* − μ 0
α = P T ≥ s / n
x̄*
Ricaviamo s
x̄* = μ + t ⋅
0 n−1;α n
t è il valore critico della distribuzione t (tabulato o da software).
n−1;α
Osservazione cruciale:
x̄* μ μ
La formula per dipende solo da (il valore sotto H0), non da .
0 1
Implicazione: μ μ > μ
Anche se cambiamo (es.: invece di 3.5 usiamo 4.0), purché , la stessa regione critica è
1 1 0
valida.
Conclusione:
Questo test funziona non solo per ipotesi semplici (μ=3.5), ma anche per ipotesi composte come
H : μ > μ .
1 0
Test unilaterale (a una coda):
Direzione dell'alternativa determina la coda:
μ > μ
L’unica cosa importante è la relazione poiché da questa condizione dipende la forma
1 0
della regione critica:
H : μ > μ →
Se regione critica a destra
1 0
H : μ < μ →
Se regione critica a sinistra
1 0
Quindi la direzione dell’alternativa determina la forma della regione critica.
Il corrispondente test è detto TEST UNILATERALE o A UNA CODA.
Esempio azienda:
X̄ = 3.2 μ > 3
Se osserviamo , è su ciente per concludere che ?
x̄*
Dipende se supera la soglia
Test bilaterale (a due code):
Quando usarlo:
H : μ ≠ μ
Se (es.: "il fatturato è diverso da 3, ma non so se maggiore o minore").
1 0
Regione critica:
Ri utiamo H se:
0 Pagina 12 di 70
fi
fi fi fi ffi
s s
X̄ ≤ μ − t X̄ ≥ μ + t
oppure
0 α/2 0 α/2
n n
Nota: Qui α si divide in due code (α/2 a sinistra + α/2 a destra).
La regione di accettazione per H nel test bilaterale è:
0
s s
μ − t ≤ X̄ ≤ μ + t
0 α/2 0 α/2
n n
Riorganizzando i termini, otteniamo:
s s
X̄ − t ≤ μ ≤ X̄ + t
α/2 0 α/2
n n 1 − α
Questa è esattamente la formula dell'intervallo di con denza per μ al livello
Interpretazione:
H : μ = μ μ
Accettiamo se e solo se
0 0 0 (1 − α) μ
è contenuto nell'intervallo di con denza per .
ESEMPIO μ : [2.8,3.4]
Costruiamo un intervallo di con denza 95% per
H : μ = 3.2 →
Se accettiamo H (3.2 è nell'intervallo)
0 0
H : μ = 3.6 →
Se ri utiamo H (3.6 non è nell'intervallo)
0 0
Conclusione:
Test d'ipotesi e intervalli di con denza sono due facce della stessa medaglia.
μ
- L’intervallo di con denza ci dice quali valori di sono plausibili
μ
- Il test veri ca se un valore speci co è plausibile
0
ESEMPIO: (SI CAPISCE BENE COSI’)
x̄ = 3.167 H : μ = μ H : μ = μ
Con , s=2, n=400, vs ma visto che la condizione è che
0 0 1 1
μ > μ H : μ1 > μ
quindi è come se fosse
1 0 1 0
μ = 3
Ricordiamo che :
0
x̄ − μ 3.167 − 3
0
T = = = 1.6738
s / n 2/ 400
Test Unilaterale Destro: Vogliamo vedere se la media è signi cativamente maggiore di un certo
valore ipotizzato (sotto l'ipotesi nulla H₀). La "regione critica" (dove ri utiamo H₀) è tutta nella coda
destra della distribuzione.
Approssimazione alla Normale Standard: Quando i gradi di libertà sono su cientemente grandi
(in genere n ≥ 30), la distribuzione t di Student è molto simile alla distribuzione Normale Standard
(quella con media 0 e deviazione standard 1). Questo permette di usare i valori critici (z) della
normale invece di quelli (t) della t di Student.
Livello di Signi catività (α): È la probabilità di ri utare erroneamente l'ipotesi nulla H₀ quando è
vera. È ssato a priori dal ricercatore (es. α = 5% = 0.05 o α = 2.5% = 0.025).
Valore Critico (z o t ): È il valore sulla distribuzione (normale o t di Student) che delimita la
α α
regione critica. Per un test unilaterale destro, è il valore tale che l'area alla sua destra sotto la
curva è esattamente α.
Spiegazione Passo-Passo:
Il Dato:
1) Hai un valore standardizzato (statistica test) calcolato t = 1.6738. Questo valore
rappresenta "quanto la tua media campionaria si discosta dalla media ipotizzata sotto H₀", in
termini di errori standard.
La Regola Decisionale:
2) La regola dice: "Ri uta l'ipotesi nulla H₀ se il valore t osservato è
maggiore o uguale al valore critico t_{n-1,α} (o z_α nell'approssimazione)".
R = t : t ≥ t
n−1,α Pagina 13 di 70
fi fi fi fi fi fi fi fi fi fi fi fi fi fi ffi
L'Approssimazione Normale:
3) Il testo dice che siccome i gradi di libertà (n-1) sono almeno
30, possiamo approssimare la distribuzione t di Student con una Normale Standard
(distribuzione Z).
• Conseguenza: Invece di cercare il valore critico t sulle tavole della t di Student (che
n-1,α
dipendono da n-1), possiamo usare il valore critico z dalle tavole della normale standard
α
(che è sso per un dato α).
4) Ricavare i Valori Critici z_α per la Normale Standard:
• Caso 1: α' = 5% = 0.05 (Test Unilaterale Destro)
• Cerchiamo il valore z tale che l'area alla sua destra sotto la curva normale standard sia
0.05.
• Per simmetria, questo corrisponde a trovare il valore z tale che l'area alla sua sinistra
sia (1 - 0.05) = 0.95.
• Dove si trova questo valore? Guardando una tavola standard:
• L'area 0.95 si trova tra z = 1.64 e z = 1.65.
Più precisamente, il valore z per cui l'area a sinistra è 0.95 è z ≈ 1.645.
• Signi cato: Se H₀ è vera, solo il 5% dei campioni casuali produrrebbe un valore t
maggiore di 1.645.
• Caso 2: α'' = 2.5% = 0.025 (Test Unilaterale Destro)
• Cerchiamo il valore z tale che l'area alla sua destra sotto la curva normale standard sia
0.025.
• Per simmetria, questo corrisponde a trovare il valore z tale che l'area alla sua sinistra
sia (1 - 0.025) = 0.975.
• Dove si trova questo valore? Guardando la tavola:
• L'area 0.975 si trova tra z = 1.96 e z = 1.97.
• Più precisamente, il valore z per cui l'area a sinistra è 0.975 è z ≈ 1.96.
• Signi cato: Se H₀ è vera, solo il 2.5% dei campioni casuali produrrebbe un valore t
maggiore di 1.96.
5) Confronto e Decisione:
• Caso α' = 5% (z ≈ 1.645):
α'
• Il tuo valore osservato è t = 1.6738.
• Confronto: 1.6738 > 1.645?
• Sì, 1.6738 è maggiore di 1.645.
• Conclusione: Il valore osservato cade nella regione critica (t ≥ 1.645). Quindi si
ri uta l'ipotesi nulla H₀ al livello di signi catività del 5%.
• Caso α'' = 2.5% (z ≈ 1.96):
α''
• Il tuo valore osservato è sempre t = 1.6738.
• Confronto: 1.6738 > 1.96?
• No, 1.6738 è minore di 1.96.
• Conclusione: Il valore osservato non cade nella regione critica (t ≥ 1.96).
Quindi non si ri uta (si accetta) l'ipotesi nulla H₀ al livello di signi catività del
2.5%.
Con &alph