vuoi
o PayPal
tutte le volte che vuoi
METODI STASTICI PER L’ECONOMIA
Test d’ipotesi
Un’ipotesi
DEF è un’affermazione su un parametro della popolazione.
La definizione di ipotesi è piuttosto generica, ma il punto importante è che un’ipotesi fa un’affermazione
sulla popolazione. L’obiettivo di un test di ipotesi è quello di decidere, sulla base di un campione della
popolazione, quale delle due ipotesi complementari è vera
Le
DEF due ipotesi complementari di un test si chiamano ipotesi nulla e ipotesi alternativa. Sono indicate
rispettivamente con e .
0 1
Se denota un parametro della popolazione, il formato generale delle ipotesi nulle e alternative è
: ∈ Θ : ∈ Θ Θ Θ
e , dove è un sottoinsieme dello spazio dei parametri e è il suo complemento.
0 0 1 0
0 0
In un problema di verifica di ipotesi, dopo aver osservato il campione lo sperimentatore deve decidere se
accettare come vero o rifiutare come falso e decidere che è vero.
0 1
DEF Una procedura di verifica delle ipotesi o test di ipotesi è una regola che specifica:
1. Per quali valori del campione si decide di accettare come vero.
0
2. Per quali valori campionari viene rifiutato e viene accettato come vero.
0 1
Il sottoinsieme dello spazio campionario per il quale gli saranno rifiutati è chiamato regione di rifiuto o
0
regione critica. Il complemento della regione di rifiuto è chiamato regione di accettazione.
Metodi di ricerca dei test:
- Test del rapporto di verosimiglianza
Il metodo del rapporto di verosimiglianza per la verifica delle ipotesi è correlato agli stimatori della
massima verosimiglianza e i test del rapporto di verosimiglianza sono ampiamente applicabili come la
, … ,
stima della massima verosimiglianza. Ricordiamo che se è un campione casuale da una
1
(|) (
popolazione con pdf o pmf può essere un vettore), la funzione di verosimiglianza è definita
come
(| ) (| ) ( |) ∏
, … , = = = ( |)
1
=1
Sia a denotare l’intero spazio dei parametri. I test del rapporto di verosimiglianza sono definiti come
segue
: ∈ Θ : ∈ Θ
DEF La statistica del rapporto di verosimiglianza per testare contro è
0 0 1 0
(|)
Θ
0
() = (|)
Θ {: () ≤
Un test del rapporto di verosimiglianza (LRT) è un test che ha una regione di rifiuto della forma
}, 0 ≤ ≤ 1.
dove è un numero qualsiasi che soddisfa (|)
La logica alla base degli LRT può essere meglio compresa nella situazione in cui è la pmf di una
()
variabile casuale discreta. In questo caso, il numeratore di è la massima probabilità del campione
()
osservato, calcolata sui parametri dell’ipotesi nulla. Il denominatore di è la massima probabilità del
campione osservato su tutti i parametri possibili. Il rapporto tra questi due massimi è piccolo se ci sono
punti dei parametri nell’ipotesi alternativa per i quali il campione osservato è molto più probabile che per
qualsiasi punto dei parametri nell’ipotesi nulla. In questa situazione, il criterio LRT dice che dovrebbe
0
essere rifiutato e accettato come vero.
1
Se pensiamo di effettuare la massimizzazione sia sull’intero spazio dei parametri (massimizzazione non
ristretta) sia su un sottoinsieme dello spazio dei parametri (massimizzazione ristretta) allora la
corrispondenza tra LRT e MLE diventa più chiara.
̂ ̂
; (|).
Supponiamo che esista , un MLE di si ottiene facendo una massimizzazione non ristretta di
̂
,
Possiamo anche considerare il MLE di chiamato , ottenuto con una massimizzazione ristretta,
0
̂ ̂
Θ = () ∈ Θ
assumendo che sia lo spazio dei parametri. Cioè, è il valore di che massimizza
0 0 0 0
(|).Quindi, la statistica LRT è (̂ |)
0
() = (̂|)
LRT Normale
, … , (, 1).
Sia un campione casuale di una popolazione Consideriamo di testare le ipotesi
1
: = : ≠
contro . Qui è un numero fissato dallo sperimentatore prima dell’esperimento.
0 0 1 0 0 ()
( |).
Poiché esiste un solo valore specificato da , il numeratore di è Quindi il denominatore di
0 0
() (̅ |).
è Quindi la statistica LRT è
()
L’espressione per può essere semplificata osservando che
La statistica LRT è quindi 2
() = exp[−(̅ − ) /2]
0
()
Un LRT è un test che rifiuta per piccoli valori di . La regione di rifiuto, che in questo caso è
0
{: () ≤ }, può essere scritta come {: |̅ − | ≥ )/}
√−2(log
0
Dove:
- è compreso tra 0 e 1
)/ ∞
- è compreso tra 0 e
√−2(log : =
Pertanto, i test LRT sono solo quelli che rifiutano se la media del campione differisce dal valore
0 0
ipotizzato o di più di una quantità specificata.
LRT Esponenziale
, … ,
Sia un campione casuale da una popolazione esponenziale con pdf
1 −(−)
{ ≥
( |)
= 0 >
−∞ < < ∞.
Dove La funzione di verosimiglianza è
−Σ +
≤
(1)
(| ) {
= 0 >
(1)
: ≤ : >
Si consideri il test contro , dove è un valore specificato dallo sperimentatore. È
0 0 1 0 0
( | ) ()
−∞ < <
chiaro che è una funzione crescente di su . Pertanto, il denominatore di , il
(1)
( | )
massimo non limitato di , è −Σ +
|)
( = (1)
(1)
() (|)
|).
≤ ( ≤
Se , il numeratore di è anche Ma poiché stiamo massimizzando su ,
(1)
(1) 0 0
() (| )
>
il numeratore di è se . Pertanto, la statistica test del rapporto di verosimiglianza è
(1) 0 1 ≤
(1) 0
() {
= −( − )
>
(1) 0 (1) 0 log
() {: }.
< , ≥ −
Un LRT, un test che rifiuta se è un test con regione di rifiuto
0 (1) 0
Si noti che la regione di rifiuto dipende dal campione solo attraverso la statistica sufficiente .
(1)
() (|),
Se è una statistica sufficiente per con pdf e pmf allora potremmo considerare di costruire un
∗ (|)
= (|),
LRT basato su e sulla sua funzione di verosimiglianza piuttosto che sul campione X e
∗
( | ) ()
sulla sua funzione di verosimiglianza . Sia la statistica test del rapporto di verosimiglianza
. (),
basato si Data la nozione intuitiva che tutte le informazioni su in x sono contenute in il test
basato su dovrebbe essere altrettanto valido del test basato sul campione completo X. In realtà i test
sono equivalenti. ∗
()
() ()
Teorema se è una statistica sufficiente per e e sono le statistiche LRT basate su e X,
∗ (())
= ()
rispettivamente, allora per ogni x nello spazio campionario.
( | ) (( |)ℎ(),
=
Prova dal teorema di fattorizzazione, la pdf o pmf di X può essere scritta come
(|) ℎ() .
dove è la pdf o pmf di e non dipende da Quindi
LRT normale con varianza sconosciuta 2
, … , (, )
Supponiamo che sia un campione casuale da un e che uno sperimentatore sia
1 2
, : ≤ : >
interessato solo alle differenze su con le ipotesi contro . Allora il parametro è
0 0 1 0
un parametro di disturbo.
La statistica LRT è
2 2
̂ ̂ ̂ ≤
Dove e sono i MLE di e . Inoltre, se , allora il massimo ristretto è uguale al massimo non
0 02 02 2
̂ > ( , ̂ |), ̂ = Σ( − ) /.
ristretto, mentre se , il massimo ristretto di dove Quindi
0 0
Metodi di valutazione dei test
Nel decidere di accettare o rifiutare l’ipotesi nulla , uno sperimentatore potrebbe commettere un errore.
0
Di solito, i test d’ipotesi vengono valutati e confrontati in base alle loro probabilità di errore. In questa
sezione discutiamo di come queste probabilità di errore possano essere controllate. In alcuni casi, si può
persino determinare quali test hanno le probabilità di errore più basse possibili.
Probabilità di errore e funzione di potenza
: ∈ Θ : ∈ Θ
Un test di ipotesi di rispetto a potrebbe produrre due tipi di errori. A questi due tipi
0 0 1 0
di errori sono stati attribuiti i nomi di Errore di tipo I e di Errore di tipo II.
∈ Θ
Se ma il test di ipotesi decide erroneamente di rifiutare , allora il test ha commesso un Errore di
0 0
tipo I.
∈ Θ
Se invece ma il test decide di accettare , è stato commesso un Errore di tipo II
0
0 ∈ Θ
Supponiamo che denoti la regione di rifiuto di un test. Allora per , il test commetterà un errore se
0
∈ , ( ∈ ).
quindi la probabilità di Errore di tipo I è
∈ Θ ( ∈ ).
Per la probabilità di Errore di tipo II è
0
( )
∈ = 1 − ( ∈ ).
Tra le due vale l’uguaglianza
()
= ( ∈
DEF la funzione di potenza di un test di ipotesi