vuoi
o PayPal
tutte le volte che vuoi
J
rifiuto (di ). Si osserva il valore della statistica nel
J
campione osservato per vedere su quale regione cade e quale
delle due ipotesi supporta. Come statistiche test si considerano
statistiche sufficienti, che colgono tutta l’informazione sul
parametro presente nel campione. Esiste un modo alternativo ̅
Valori “piccoli” di daranno ragione a ; valori “grandi” di
J
di svolgere il test, basato sul concetto di p-value (livello di ̅
daranno ragione a . La ragione di rifiuto del test è data dai
#
significatività osservato). valori “grandi” della media campionaria, cioè valori maggiori
{̅
= > }.
rispetto a una certa soglia k:
In un test si possono commettere due tipi di errori: Per il test di secondo tipo:
•
errore di 1° specie: rifiutare anche se è vera;
J J
•
errore di 2° specie: non rifiutare anche se è : = ( ≥ )
J J J J J
¥
falsa. : < ( = < )
# J # # J
L’errore più preoccupante è il primo perché l’ipotesi nulla è
quella a cui siamo più interessati. è la probabilità di
commettere l’errore di prima specie, cioè che la statistica test
cada nella regione di rifiuto quando è vera: livello di
J
) ).
= (( , … ∈ |
significatività del test # $ J
è la probabilità di commettere l’errore di seconda specie,
cioè che la statistica test cada nella regione di accettazione ̅
Valori “grandi” di daranno ragione a ; valori “piccoli” di
J
) ).
= (( , … ∈ | 1 −
quando è falsa: è la ̅
J # $ # daranno ragione a . La ragione di rifiuto del test è data dai
#
potenza del test. Si cerca di ottenere un valore piccolo e una valori “piccoli” della media campionaria, cioè valori minori
potenza del test elevata con piccolo, ma non è possibile {̅
= < }.
rispetto a una certa soglia k:
minimizzare contemporaneamente i due valori perché se
aumenta diminuisce e viceversa. Di solito si fissa ad un Per il test di terzo tipo:
= 0,1; 0,05; 0,01; …) .
livello accettabile ( e poi si controlla : =
Per ciascuno dei problemi inferenziali, si possono testare tre J J
¥
: ≠
diverse ipotesi (tre diversi test d’ipotesi) che si differenziano # J
per il segno dell’ipotesi alternativa: ̅
Valori di in un intorno di daranno ragione a ; valori di
J J
̅
molto più grandi/piccoli di daranno ragione a . La
J #
{(̅
= < ) ∪ (̅ > )},
ragione di rifiuto del test è con
# &
e soglie.
&
~(, )
Il test su con nota di una pop. normale si # &
basa sulla media campionaria come statistica sufficiente. La
distribuzione campionaria della media campionaria è:
&
̅ −
̅ ~(, ) ⇒ ~(0,1)
,
La soglia viene calcolata in funzione di facendo in modo
√
che il test abbia un valore di fissato. Nel primo tipo di test:
Per il test di primo tipo: −
E
) | )
= (| = (̅ > = > =
§ ©
¨
: = ( ≤ )
J E J J
J J J
¥
: > ( = > ) √
# J # # J −
Estraiamo un campione e osserviamo la media campionaria: E J
= ( > ) = ( > )
E
√
14
> : =
= +
Quindi: . J J
¥
E J E √$ : <
# J ,̅
= < −
«̅ ¬.
La ragione di rifiuto del test è Per
J $"#,E √$
il test di terzo tipo: : =
J J
¥
: ≠
Nel secondo tipo di test: # J ,̅
WWW
= < − )∪
«(
La ragione di rifiuto del test è
− J $"#,E √$
E
) | )
= (| = (̅ < = < =
§ ©
¨
J E J J ,̅
(̅ > + )¬.
J $"#,E
√ √$
Il test su p di una pop. di Bernoulli si effettua solo su grandi
−
E J
= ( < ) = ( < − ) campioni. La statistica sufficiente su cui si basa il test è la
E ̂
proporzione osservata di successi :
√ (1 − ) ̂ −
>
= −
Quindi: . ̂ ~(, )⇒ ~(0,1)
E J E √$ -(1 − )
Per il test di primo tipo:
: = ≤
J J J
¥
: > = >
# J # J
Nel terzo tipo di test: {̂ }
= >
La ragione di rifiuto del test è con tale che:
E E
−
⎛ ⎞
E
) | ) °
= (| = (̂ > = >
J E J J
(1 − )
-
⎝ ⎠
−
E J
⎛ ⎞
= > = ( > )
E
(1 )
−
- J J
⎝ ⎠
B (#"B ) B (#"B )
- -
= + = > +
) ) ) )
ŷ z
e
E J E J E
$ $
Per il test di secondo tipo: ( )
: = ≥
J J J
¥
Quando è incognita, la statistica sufficiente su cui si basta ( )
: < = <
# J # J
il test è sempre la media campionaria: {̂ }
= <
La ragione di rifiuto del test è con:
& E
̅ − ̅ −
̅ ~(, ) ⇒ ~(0,1) ⇒ ~
$"#
̅
√ √ (1 − )
J J
›
= −
E J E
Per il test di primo tipo: Per il test di terzo tipo:
: =
J J
¥
: >
# J : =
J J
¥ : ≠
# J
,̅
= > +
«̅ ¬.
La ragione di rifiuto del test è Per
J $"#,E √$
il test di secondo tipo: #E &E
{(̂
= < ) ∪ (̂ > )}
La ragione di rifiuto del test è
con:
15 Ad esempio:
(1 − )
J J
›
#E
= −
E
J
& •
p-value = 0,45 > qualsiasi che possiamo scegliere,
;
quindi dà ragione ad per qualunque
J
•
p-value = 0,000023 < qualsiasi che possiamo
(1 − )
J J ;
›
&E scegliere, quindi dà ragione ad per qualunque
= +
E #
J •
&
p-value = 0,061 dipende da che abbiamo scelto. Se
= 0,05 il p-value è maggiore e diamo ragione ad
, ma se = 0,1 il p-value è minore e diamo
P-value J
ragione ad .
#
Un metodo alternativo per fare un test prevede l’uso del p- Per il calcolo del p-value dobbiamo applicare la definizione.
value, cioè del livello di significatività osservato. Il p-value è Nel primo caso (ipotesi alternativa ha segno >):
la probabilità di osservare un valore della statistica test più
estremo (rispetto ad : se ha segno minore, “più piccolo”;
# # : = ( ≤ )
se ha segno maggiore, “più grande”) di quello effettivamente J J J
¥
osservato condizionatamente ad (se fosse vera ). Ad : > ( = > )
J J # J # # J
esempio: )
− = (( … > ( … )| )
# $ # $ J
: = 0,5
J = 25 ̂ = 0,75
¥ , e
: = 0,8
# In questo caso il p-value è la probabilità che la statistica test
sia maggiore del valore osservato della statistica test nel
In questo caso il p-value è la probabilità di osservare un valore
campione dato .
J
della statistica test (̂ ) più grande di 0,75 condizionatamente
̂ (1 −
ad . Se fosse vera , i parametri di sarebbero e
J J J J
)/. Dato che l’ipotesi nulla dice che p = 0,5 la curva della
J
normale è centrata su questo valore. Nel caso in cui l’ipotesi alternativa abbia segno di minore:
: = ( ≥ )
J J J
¥ : < ( = < )
# J # # J
) )| )
− = (( … < ( …
# $ # $ J
Quindi stiamo calcolando con il p-value l’area tratteggiata in
̂
rosso, cioè quando osservato è maggiore di 0,75. Questo In questo caso il p-value è la probabilità che la statistica test
valore cade nella regione di rifiuto (dà ragione all’ipotesi sia minore del valore osservato della statistica test nel
̂
alternativa). Valori di che danno ragione all’alternativa sono
campione dato .
J
sempre associati a p-value piccoli. Vediamo un altro caso:
: = 0,5
J = 25 ̂ = 0,55
¥ , e
: = 0,8
# Nel caso in cui l’ipotesi alternativa abbia segno di diverso:
: =
J J
¥ : ≠
# J
̂
Il valore = 0,75 dà ragione all’ipotesi nulla. In questo caso il Il p-value è il doppio del corrispondente p-value con
p-value è la probabilità di osservare un valore della statistica alternativa unidirezionale.
test (̂ ) più