Che materia stai cercando?

Anteprima

ESTRATTO DOCUMENTO

Modulo II – Minimi quadrati

″ ′ (2.3.13)

′ ′

χ < σ ≤ χ

2 2 2

ˆ ˆ ˆ ˆ

u u u u

/ /

− −

n k n k ′

α =0.05 =10, χ 2

Per e per i tre numeri di gradi di libertà i quantili

n−k 20, 30, −

n k

χ 2

, e , ed i quantili , e rispettivamente

valgono 3.51 9.95 17.21 21.72 35.22 47.96

n k

2

χ non è simmetrica, i quantili sinistro e

(si noti che dato che la distribuzione del 9

destro per il test bilaterale differiscono in valore assoluto). Come vedremo al

termine di questo paragrafo, con la stessa logica si può costruire un test per

2

σ

l’ipotesi lineare .

H : = r

0

Verifica di ipotesi lineari semplici nel modello lineare multiplo β ≠

L’ipotesi nulla (2.2.20) può essere verificata contro l’alternativa , nel caso

H : r

1 i i

2

σ

di sconosciuto, direttamente utilizzando l’intervallo di confidenza (2.3.12): se

β =

questo contiene il punto si accetta l’ipotesi nulla, altrimenti la si rifiuta e si

r

i i

accetta l’alternativa.

Una seconda maniera di procedere è analoga al test di ipotesi presentata nel

paragrafo 2.2 e consiste nel verificare se la statistica

ˆ

β − r

= i i

t (2.3.14)

i s i ′ ′

è compresa nell’intervallo di accettazione oppure in quello di rifiuto

[

t , t )

− −

n k n k

composto dalle due semirette

′ ′′

e

t<t t≥t

n-k n-k

dove la di Student è considerata per gradi di libertà.

t n−k

Questo test è eseguibile in un’ulteriore forma. Si calcola la probabilità che la

~ assuma un valore assoluto maggiore od uguale al valore

variabile aleatoria t α/2

trovato e la si confronta con : se è minore si rifiuta l’ipotesi nulla. Tale

t i

probabilità è detta livello di significatività marginale e un suo valore vicino allo

10

zero implica che la data dalla (2.3.14) molto difficilmente possa essere considerata

t i

statisticamente nulla.

Naturalmente il test può essere esteso coinvolgendo nel medesimo vincolo più

parametri, come accade nella (2.2.26), nel qual caso la statistica (2.2.27) va

modificata nel modo seguente

La distribuzione del chi quadrato è illustrata nella figura XXI-1.2.

9 In lingua inglese: marginal o empirical significance level o anche, più spesso, p-value.

10 2-15

Modulo II – Minimi quadrati

ˆ

′ −

β

c r

t = ~ t (2.3.15)

n k

( ) −

′ ′ 1

σ c X X c

Un’applicazione: il test di nullità sui parametri della funzione delle importazioni

Riprendiamo ora il sistema di ipotesi (2.2.22) con il quale si verifica l’ipotesi di

nullità dell’i-esimo coefficiente

β = = =

H : r 0 i 1, 2, …, k

0 i i

In questo caso la statistica (2.3.14) si riduce semplicemente al rapporto fra il

coefficiente stimato e il relativo scarto quadratico medio

ˆ

β

= i

t (2.3.16)

i s i

In altre parole, la statistica consiste nel coefficiente “standardizzato”, o, come

anche si usa dire, con una terminologia forse più precisa, ma ugualmente cattiva

dal punto di vista linguistico, “studentizzato” in modo da renderlo adimensionale.

11

Osservazione 2.5 - Il valore (2.3.14) o il suo caso particolare (2.3.16), per

12 I programmi di calcolo

ovvii motivi, sono talvolta chiamati rapporto t.

econometrico associano automaticamente a ogni coefficiente il rapporto

(2.3.16), che viene definito per antonomasia la “t di Student” del

coefficiente.

La consultazione delle t di Student fornisce utili indizi circa la validità del

modello stimato. Vediamo ora come si interpretano concretamente questi rapporti ,

che usualmente vengono riportati sotto le stime, analizzando le quattro versioni

stimate dell’equazione delle importazioni, cioè le (2.3.17), (2.3.18), (2.3.19) e

(2.3.20), che riportiamo per comodità del lettore corredando i coefficienti con le

relative t di Student:

=

ln ŷ −

-6.023 + 0.572 lnx + 0.900 lnx 0.164 lnx + 0.104 lnx

t 1t 2t 3t 4t (2.3.17)

(-6.1) (6.6) (22.2) (-8.5) (3.3)

2 2

= = =

n = 80, R 0.984, R = 0.983, RSS 0.063, SEE 0.029

c

Si parla di standardizzazione quando una variabile aleatoria viene divisa per il proprio

11

scarto quadratico medio. Nel caso in questione lo scarto quadratico medio non è noto e si

usa una sua stima; dato che il rapporto che ne risulta è distribuito come una t di Student,

viene talora impiegato il termine “studentizzazione”.

t

In lingua inglese: -ratio.

12 2-16

Modulo II – Minimi quadrati

=

ln ŷ −

-8.095 + 0.827 (lnx + lnx ) 0.162 lnx + 0.056 lnx

t 1t 2t 3t 4t (2.3.18)

(-10.4) (23.2) (-7.9) (3.3)

2 2

= = =

n = 80, R 0.982, R = 0.981, RSS 0.071, SEE 0.030

c

=

ln ŷ -3.344 + 0.355 lnx +0.876 lnx - 0.173 (lnx - lnx )

t 1t 2t 3t 4t (2.3.19)

(-16.4) (9.1) (21.1) (-8.7)

2 2

= = =

n = 80, R 0.982, R = 0.982, RSS 0.069, SEE 0.030

c

=

ln ŷ -3.292 + 0.607 (lnx + lnx ) - 0.190 (lnx - lnx )

t 1t 2t 3t 4t (2.3.20)

(-13.0) (52.3) (-7.6)

2 2

= = =

n = 80, R 0.972, R = 0.972, RSS 0.111, SEE 0.037

c

I valori delle di Student, riportati fra parentesi sotto i coefficienti, vanno

t

confrontati con i quantili ricavati dalle tavole statistiche della distribuzione, che

dipendono dai gradi di libertà del modello. Ricordiamo che al divergere dei gradi di

libertà la di Student converge a una normale standardizzata, con un processo di

t

convergenza molto rapido per valori piccoli dei gradi di libertà (si veda la figura

XXI-1.4). In pratica, ciò significa che la forma della distribuzione (e quindi il valore

dei relativi quantili) cambia molto meno passando da 60 a 120 gradi di libertà che

non passando da 2 a 3 gradi di libertà. Di conseguenza le tavole statistiche

riportano i quantili per incrementi unitari (1, 2, 3,…) dei gradi di libertà solo fino a

un certo valore (ad es., 30), dopo il quale la distribuzione viene tabulata per

incrementi via via più ampi.

Questo vuol dire che se il nostro modello ha un numero elevato di gradi di

libertà (indicativamente, superiore a cinquanta), probabilmente non troveremo

tabulata la distribuzione esattamente corrispondente. Ad esempio, nelle quattro

equazioni considerate i gradi di libertà variano da (nella 1.9.5) a (nella

75 77

1.11.4), ma la tavola della di Student riportata da Johnston [1984, p. 548] tabula

t

la distribuzione solo per 60 o 120 gradi di libertà. In questi casi possiamo utilizzare

una zona di accettazione approssimata costruita scegliendo i quantili riferiti alla

distribuzione con il numero di gradi di libertà più vicino a quello del nostro

modello, ad esempio, 60. Leggendo sulla tavola i quantili della che isolano

t 60

α/2

un’area pari ad costruiamo per simmetria gli intervalli di accettazione, che

risultano pari a

+2.660) α =0.01

per

[−2.660, 2-17

Modulo II – Minimi quadrati

+2.000) α =0.05

per

[−2.000,

+1.671) α =0.10

per

[1.671,

Questi intervalli sono approssimazioni dell’intervallo esatto (cioè di quello

relativo a una distribuzione con 75, 76 o 77 g.d.l.). Dato che la distribuzione diviene

progressivamente più concentrata al divergere dei gradi di libertà, se i valori

13

prescelti sono inferiori a quelli effettivi (come nel nostro caso, essendo 60<75)

l’intervallo approssimato è più ampio di quello esatto, per cui il test tende a far

accettare la nulla più spesso del dovuto (è quindi meno potente, perché tende a far

rifiutare di meno la nulla sia quando è vera che quando è falsa): in pratica, si corre

il rischio di considerare non significativo un parametro che invece lo è. Se invece

scegliessimo un valore dei g.d.l. superiore a quello effettivo, ad esempio costruendo

le regioni di accettazione per 120 g.d.l., si avrebbero intervalli più concentrati

+2.617) α =0.01

per

[-2.617, +1.980) α =0.05

per

[−1.980, +1.658) α =0.10

per

[−1.658,

nel qual caso l’approssimazione porterebbe a un test che fa respingere la nulla

troppo spesso, e quindi ha livello di significatività effettivo superiore a quello

nominale (la probabilità di respingere la nulla quando è vera è superiore al valore

α prescelto).

Come si vede, però, per g.d.l. superiori a 50 l’errore di approssimazione

riguarda al più la seconda cifra decimale ed è quindi praticamente irrilevante nella

maggior parte dei casi, compreso quello della funzione delle importazioni

sopraindicata. Infatti, nelle quattro equazioni riportate la di Student più piccola

t

in valore assoluto è quella di nella (2.3.18) pari a 3.3, e quindi cade al di fuori

lnx 4t

dell’intervallo di accettazione più ampio fra quelli considerati. In altri termini,

l’ipotesi che in queste equazioni vi sia un coefficiente statisticamente non

significativo viene respinta.

Si noti anche che, come è intuitivo, l’intervallo di accettazione si restringe

α. α

all’aumentare di Questo perché è la probabilità di rifiutare l’ipotesi nulla

Questa proprietà ha un significato intuitivo: i gradi di libertà aumentano con la

13

numerosità campionaria; quanto maggiore è l’informazione campionaria di cui disponiamo,

tanto minore sarà l’incertezza relativa ai risultati delle stime, e quindi tanto più

concentrate saranno le relative distribuzioni di probabilità. Naturalmente questo

ragionamento si basa sul presupposto che all’aumentare della numerosità campionaria la

struttura dei dati non cambi, cioè che i dati siano perfettamente omogenei. Questo

presupposto in economia deve essere attentamente verificato. Alcuni strumenti statistici

per effettuare questa verifica verranno introdotti nel successivo capitolo 3. 2-18

Modulo II – Minimi quadrati

quando è vera, e la probabilità di rifiutare la nulla è tanto maggiore quanto più

α

piccola è la regione di accettazione del test. La scelta di dipende da diversi fattori,

fra i quali le convinzioni a priori del ricercatore o il fatto che il test venga condotto

isolatamente ovvero in una procedura sequenziale di verifica sui parametri del

modello. Osservazione 2.6 - Il livello di significatività più usuale per questo test,

α =

detto della di Student, come per gli altri che seguiranno, è . I

t 0.05

±2.0

quantili ad esso associati per gradi di libertà, , vengono spesso

60

utilizzati per effettuare il test in modo approssimativo, senza consultare

le tavole della distribuzione relativa. Come abbiamo appena constatato,

l’errore di approssimazione è trascurabile nella maggior parte dei casi.

Spesso, nel riportare le equazioni econometriche, al posto della di Student si

t

usa mettere tra parentesi tonde gli errori standard delle stime; in questo caso il

s i

valore da adoperare nel test della di Student è calcolato semplicemente mediante

t t =0

β̂

il rapporto . Generalmente, se si è interessati al solo test della , con , è

t r

/ s i

i i

più utile avere tra parentesi tonde direttamente i valori ; se invece si desidera

t i

≠0

effettuare test con è più conveniente avere tra parentesi gli errori standard (se

r i β̂

non li si hanno, vengono immediatamente determinati tramite il rapporto ).

/ t

i i

Verifica di ipotesi lineari semplici per la varianza dei residui

L’ipotesi nulla 2

σ = (2.3.21)

H : r

0 2

σ ≠r utilizzando l’intervallo di

può essere verificata contro l’alternativa H :

1 2

σ =r

confidenza (2.3.13): se questo contiene il punto si accetta l’ipotesi nulla,

altrimenti la si rifiuta e si accetta l’alternativa.

Si può, altro canto, procedere con un test di ipotesi che sfrutti direttamente il

risultato (2.3.7), costruendo il valore ′

χ = (2.3.22)

2 ˆ ˆ

u u / r formato da

e verificando se è compreso nell’intervallo di accettazione per H

0

′ ″

χ χ

2 2 oppure in quello di rifiuto composto dalle due parti

[ , )

− −

n k n k ′ ″ (2.3.23)

χ ≥ χ

≤ χ < χ

2 2 2 2

e

0 − −

n k n k

α/2 e rispettivamente.

dove i due quantili hanno probabilità 1−α/2

α=0.05 nel caso dell’equazione (2.3.17) è

L’intervallo di confidenza (2.3.13) per 2

χ

facilmente determinabile, se si considera che dalla tavola della distribuzione del

si ottiene, per gradi di libertà,

75 2-19

Modulo II – Minimi quadrati

′ ″

χ = χ =

2 2

,

52

.

96 100

.

82

75 75

= =

ˆ ˆ , per cui l’intervallo è

Si ha, inoltre, che u u 0 . 0633

RSS

[0.00063 , 0.00119) 2-20

Modulo II – Minimi quadrati

2.4 Verifica di ipotesi lineari multiple

Nel paragrafo 1.11 sono state determinate le stime dei minimi quadrati dei

β

parametri del modello lineare (1.3.4) in modo che esse soddisfacessero

identicamente ai vincoli rappresentati dal sistema di equazioni lineari (1.11.9); si

q β β =

ottenevano così le stima dei minimi quadrati vincolati , tali che . Ora

R r

0 0

β

modifichiamo questo argomento supponendo di stimare prima senza vincoli, ad

esempio con il criterio dei minimi quadrati, e di verificare dopo se questi vincoli

sono rispettati, cioè se è valida l’ipotesi nulla, formata dalle relazioni lineari

q

β = (2.4.1)

R r

H :

0

rispetto all’alternativa β ≠ (2.4.2)

R r

H :

1

è una matrice di ordine ed è un vettore di elementi. Dunque il

dove R r

q×k q

problema di stima vincolata del paragrafo 1.11 viene modificato in uno di verifica

β

delle ipotesi lineari (2.4.1): è una stima che necessariamente soddisfa ai vincoli

0

β̂

(1.11.9), mentre è una stima che può verificare o meno l’ipotesi nulla (2.4.1)

costituita dagli stessi vincoli.

Il sistema di ipotesi (2.4.1)-(2.4.2) comprende come caso particolare quello in cui

la matrice ha righe, nel qual caso siamo ricondotti alla (2.2.26), dove in

R q = 1

effetti si è posto . Di conseguenza, l’ipotesi nulla (2.2.22)

R c

= β =

H : 0

0 i

che è un caso particolare della (2.2.26) e che viene verificata mediante il test della z

2

σ

con la statistica (2.2.21) nel caso in cui sia noto e con quello della di Student

t

2

σ

dato dalla statistica (2.3.14) nel caso in cui sia ignoto, può anche essere vista

=

come caso particolare della (2.4.1) per e con

q 1

= = (2.4.4)

R r

[0 0 … 1 …0] 0

-esimo

elemento i , con ancora data

La stessa ipotesi nulla (2.2.20) diventa la (2.4.1) per R

q=1

=

dalla prima della (2.4.4) ed , mentre l’ipotesi di uguaglianza di due parametri,

r r i

ad esempio la (1.11.3), può essere scritta nel modo

β −β = (2.4.5)

H : 0

0 2 3 ,

cioè, nella forma generale (2.4.1) con q=1

= −1 =

R r

[0 0 … 1 …0] 0 2-21

Modulo II – Minimi quadrati

Nella discussione riferita al modello (2.2.28) abbiamo anche illustrato come

impostare il test per un’ipotesi di omogeneità del tipo (1.11.4).

Tuttavia è chiaro che in tutti questi casi, nei quali abbiamo a che fare con un

unico vincolo (eventualmente riguardante più parametri) disponiamo già di un

risultato distribuzionale, il (2.2.27), opportunamente esteso dal (2.3.15) al caso di

2

σ ignoto, che consente di verificare l’ipotesi di interesse mediante una statistica

distribuita rispettivamente come una normale o come una di Student. La

t

formulazione (2.4.1) diventa quindi veramente utile nel momento in cui abbiamo a

che fare con l’imposizione simultanea di più di un vincolo. Questo va tenuto

presente anche se, nel prosieguo, alcuni nostri esempi saranno riferiti, per non

appesantire i calcoli, al caso in cui (cioè al caso in cui si verifica un unico

q = 1

vincolo). 14 β̂ .

Per verificare l’ipotesi (2.4.1) si considera la trasformata lineare R

β̂

Ricordando che ha la distribuzione multinormale specificata dalla (2.2.8), il

β̂

teorema XXI-2.3 ci permette di ricavare la distribuzione di , che sarà anch’essa

R

normale multivariata 2 -1

β̂ ∼ β σ ′ ′]

,

R R R X X R

N[ ( )

-1

′ ′ come nella (1.11.16),

ovvero, ponendo U R X X R

= ( ) (2.4.6)

2

β̂ ∼ β σ

,

R R U

N[ ]

da cui segue immediatamente che (2.4.7)

2

β̂ β ∼ σ

- ,

R R 0 U

N[ ] 2

σ è

Ora, per quanto esposto nel paragrafo 1.11, la matrice di dispersione U

definita positiva ed è quindi possibile applicare il teorema XIX-1.14. Allora, la

forma quadratica (2.4.8)

-1 2

β̂ β)′ β̂ β)/σ ∼ χ 2

- -

R R U R R

( ( q

e divisa per l’altra forma quadratica (2.3.7), rapportate ambedue ai rispettivi gradi

di libertà, conduce alla

ˆ ˆ ˆ ˆ

′ ′

− −

β − β β − β σ β − β β − β −

1 2 1

R R U R R R R U R R

( ) ( ) / q ( ) ( ) ( n k )

= ⋅ ∼ F (2.4.9)

′ ,

q n k

′ σ −

2 ˆ ˆ

ˆ ˆ u u q

u u / ( n k )

Alcuni programmi di calcolo econometrico, fra i quali Easy Reg 2000 Basic, utilizzano

14

sempre per la verifica di ipotesi lineari la formulazione generale (2.4.1) e quindi non

effettuano il test (2.3.15) in chiave di t di Student. 2-22

Modulo II – Minimi quadrati

avendo sfruttato il risultato di teoria delle probabilità secondo il quale il rapporto

χ

di due variabili aleatorie distribuite come si distribuisce come una di Fisher se

F

2

esse sono indipendenti e divise ciascuna per il proprio numero dei gradi di libertà;

questi due numeri costituiscono, poi, la coppia dei gradi di libertà della di Fisher

F

(si veda la XXI-(1.6.11)).

Rimane quindi da dimostrare l’indipendenza del numeratore della (2.4.9)

rispetto al denominatore. A questo scopo utilizziamo il teorema XIX-2.7,

considerando che sia il numeratore che il denominatore della (2.4.9) sono forme

~

quadratiche aleatorie nel vettore associate a matrici idempotenti. Abbiamo

u

infatti per il numeratore ~ ~

ˆ ˆ (2.4.10)

′ ′ ′ ′ ′ ′ ′

− − − −

β β β β

− − =

1 1 1 1

R U R u X X X R U R X X X u

( ) ( ) ( ) ( )

dove si è fatto uso della (1.6.16) mentre per il denominatore abbiamo già visto che

vale la ~ ~

′ ′

=

ˆ ˆ

u u u M u (2.4.11)

dove si sono utilizzate le (1.7.6) e (1.7.4). L’idempotenza della matrice in (2.4.11) è

stata mostrata con la (1.7.5) e la dimostrazione dell’idempotenza della matrice in

è anche

(2.4.10) è lasciata al lettore. Poiché MX 0

=

′ ′ ′ ′

− − − =

1 1 1

X X X R U R X X X M 0

( ) ( )

e quindi applicando il teorema XIX-2.7 si dimostra l’indipendenza delle due forme

quadratiche a numeratore e a denominatore della (2.4.9).

Se è vera l’ipotesi nulla (2.4.1) il rapporto

ˆ ˆ

′ −

β β β β −

− −

1

R R U R R

( ) ( ) ( n k )

⋅ ∼ F (2.4.12)

ˆ ˆ

u u q β̂ β

si colloca vicino allo zero, perché la distanza fra e è trascurabile e quindi

R R

α

l’ipotesi nulla stessa è verificata al livello se il valore cade nell’intervallo di

F

′) ′

accettazione dove l’estremo destro è il quantile di probabilità

[0 , F F 1−α

q,n-k q,n-k

della distribuzione della di Fisher con ed gradi di libertà. Se il valore

F q n−k F

cade fuori dell’intervallo, si rifiuta e si accetta l’ipotesi alternativa (2.4.2). La

H

0

funzione di densità del tipo è illustrata nella figura XXI-1.5.

F

Anche in questo caso il test può essere condotto utilizzando il livello di

~ ≥ dove è il

significatività marginale o p-value definito dalla probabilità P ( F F ) F

α

valore dato dalla (2.4.12). Se questa probabilità è inferiore ad si è spinti a

rifiutare l’ipotesi nulla (2.4.1); se è maggiore la si accetta.

Esempio 2.1 - Se occorre verificare l’ipotesi nulla (2.4.3) con le posizioni

e

(2.4.4) si ha che q=1 2-23

Modulo II – Minimi quadrati

ˆ ˆ

β − = β = 2

e

R r U a

i ii -1

2

dove è l’elemento -esimo della diagonale principale di . Allora

X X

i ( )

a ii

il rapporto (2.4.12) diventa

ˆ ˆ

β β

2 2

= =

i i

F (2.4.13)

⋅ −

2 2

ˆ ˆ

u u /( )

a n k s

ii ii

che si distribuisce come il quadrato della variabile aleatoria di Student

t

con gradi di libertà; questo è allora uguale ad una di Fisher con

n−k F 1

e gradi di libertà, per cui ritroviamo il risultato XXI-(1.6.11) secondo

n−k

cui il test della di Fisher con un grado di libertà al numeratore è

F

equivalente al test della di Student (elevata al quadrato) illustrato nel

t

paragrafo 2.3.

Due applicazioni della verifica di ipotesi lineari β β

Verifichiamo nella (1.10.1) l’ipotesi che le due elasticità e siano uguali, cioè

2 3

l’ipotesi (1.11.3) che può esser scritta nella forma (2.4.5). Come abbiamo già notato,

in questo caso,visto che il vincolo sottoposto a verifica è uno solo, potremmo

utilizzare il test della con la statistica data dalla (2.3.15). Volendo utilizzare il

t

test (2.4.12) riprendiamo dal paragrafo 1.11 i seguenti dati

ˆ −

β = − =

1

e

R 0

.

0817

0

.

328 U =

′ , ed inoltre è

mentre dalla stima (2.3.17) sappiamo che = RSS = 0.0633 n−k 75

û û

= = =

e . Inserendo questi valori nella (2.4.12) si ottiene

r 0 (uno scalare) q 1 F 10.414

che è più grande del quantile della distribuzione della di Fisher con e gradi

F 1 75

α =

di libertà, che vale per . Questo test, quindi, ci induce a rifiutare

3.97 0.05

l’ipotesi di uguaglianza delle due elasticità. β β

e

Verifichiamo ora che nella (1.10.1) contemporaneamente le due elasticità 2 3

siano uguali e che sussista il vincolo di omogeneità di grado zero sui prezzi. In

questo caso abbiamo a che fare con la verifica contemporanea di due vincoli, e

quindi è possibile procedere solo con la statistica (2.4.12). Formalmente, il sistema

di ipotesi sottoposto a verifica è

β = β β = −

β

 : ;

H 0 2 3 4 5

 ( ) ( )

β ≠ β ∪ β ≠ −

β

:

H

 1 2 3 4 5 2-24

Modulo II – Minimi quadrati ∪

dove nell’alternativa si è fatto uso del segno di unione o somma logica , ad

15

β ≠ β β ≠

indicare che l’ipotesi nulla è respinta anche se è solo o solo (a

2 3 4 5

β ≠ β β ≠

fortiori, l’ipotesi nulla sarà respinta se è simultaneamente e ).

2 3 4 5

Facendo ancora uso del test con statistica (2.4.12) riprendiamo dal paragrafo

1.11 i valori seguenti

   

0

.

328 0 .

1510 0

.

4857

β̂ = =

1

e

R U

   

− 0

.

060 0

.

4857 3

.

4044

   

= =

′ , ed inoltre è e

mentre dalla (2.3.17) sappiamo che r

= 0.0633 n−k 75 [0 0]′

û û

= =

. Inserendo questi dati nella (2.4.12) otteniamo che è sensibilmente

q 2 F 28.210

più grande del quantile della distribuzione della di Fisher con e gradi di

F 2 75

α =

libertà che vale per . Questo test, quindi, ci induce a rifiutare l’ipotesi

3.12 0.05

doppia formulata sopra.

Verifica della bontà di adattamento complessiva di un modello

In ogni modello (1.3.4) occorre, tra le altre, verificare l’ipotesi che i parametri

relativi a tutte le variabili esplicative siano contemporaneamente nulli, definendo,

quindi, un test sulla bontà di adattamento dell’intero modello ai dati. L’ipotesi

nulla è β = β = = β = (2.4.14)

H : … 0

0 1 2 k

= relazioni lineari, per cui la (2.4.1) diventa

formata da q k β = (2.4.15)

0

= =

con ed . La (2.4.9) è

R I r 0 ˆ ˆ ˆ

′ ′ ′ ′

β β β

X X X y

( ) / k / k ∼

= (2.4.16)

F −

′ ′ ,

k n k

− −

ˆ ˆ ˆ ˆ

u u u u

/( n k ) /( n k )

avendo fatto uso delle equazioni normali (1.4.11).

Dato che la (2.4.14) annulla tutti i coefficienti, essa equivale a ipotizzare, di

, sia

fatto, che la componente sistematica della (1.3.4), cioè il valore atteso della y t

nulla. In generale, fatto salvo il caso in cui la sia espressa come scarto dalla

y t

propria media, questa ipotesi è eccessivamente restrittiva. Di conseguenza la bontà

dell’adattamento viene verificata prescindendo dall’intercetta, che supponiamo

β

essere , cioè sostituendo l’ipotesi multipla (2.4.14) con la seguente

k β = β = = β = (2.4.17)

H : … 0

0 1 2 k−1

Si veda il par. XXI-1.2.

15 2-25

Modulo II – Minimi quadrati

che equivale all’ipotesi che la componente sistematica sia costante, e quindi, in

particolare, che la variabile dipendente non venga influenzata da variazioni nel

livello delle esplicative. La statistica data dalla (2.4.16) deve essere modificata di

F

conseguenza. È conveniente a questo scopo definire in termini matriciali l’ipotesi

(2.4.17), ponendo 

1 0 0 0

L 

 0 1 0 0

L 

=

R 

 M M M M 

 0 0 1 0

L 

 -1

′ ′

matrice di ordine ( -1)× , ed ; così la matrice è data dalla

r 0 R X X R

k k = ( )

-1

sottomatrice quadrata di ordine ricavata dalla ( ) escludendo l’ultima riga e

X X

k-1

l’ultima colonna. Poiché si può effettuare la partizione , si ha

X X i

= [ ]

1

′ ′

 

X X X i

′ 1 1 1

=

X X  

i X n

 1

per cui, tenendo conto della XIX-(1.4.9)

1

 

1 [ ] [ ]

( ) − −

′ ′ ′

′ ′ ′

-1 1 1

= − =

′ ′  

X X X i i X X I i i X X CX

/ n

R X X R

( ) = 1 1 1 1 1 1 1 1

n

 

dove è la matrice di centraggio definita dalla XIX-(1.10.5) per cui la statistica

C

(2.4.12) diventa ˆ ˆ

′ ′

β β −

X CX n k ∼

1 1 1 1 F (2.4.18)

− −

′ k 1

, n k

ˆ ˆ

u u k 1

Osservazione 2.8 – La verifica dell’ipotesi che i parametri di un modello,

esclusa l’intercetta, siano globalmente nulli, viene detta per

antonomasia test della F di Fisher, anche le statistiche dei test per la

verifica di molte altre ipotesi possiedono la stessa distribuzione (in altre

parole, il (2.4.18) non è l’unico test che utilizza la F di Fisher).

Poiché, ora, per l’Osservazione 1.13 si ha che

( )

′ = − 2

ˆ ˆ ×

u u 1 R Devianza totale

ed è ˆ ˆ

′ ′ 2 ×

β β = R Devianza totale

X CX

1 1 1 1

segue che il rapporto della (2.4.18) che indichiamo con può essere espresso in

F

2

funzione di R 2-26

Modulo II – Minimi quadrati

2

R ( n k )

=

F (2.4.19)

− −

2

(

1 R )( k 1

)

Applicando la (2.4.18) (o la (2.4.19)) alle equazioni (2.3.17), (2.3.18), (2.3.19) e

(2.3.20) otteniamo rispettivamente

eq. (2.3.17): F = 1193.5 (2.49) [0.00]

4,75

eq. (2.3.18): F = 1413.1 (2.73) [0.00]

3,76

eq. (2.3.19): F = 1457.4 (2.73) [0.00]

3,76

eq. (2.3.20): F = 1382.9 (3.11) [0.00]

2,77

dove abbiamo indicato accanto a ogni statistica, fra parentesi tonde il rispettivo

valore soglia, e fra parentesi quadre il p-value. In tutti e quattro i casi la statistica

è molto più grande del corrispondente quantile della distribuzione della di Fisher

F

e pertanto si può asserire che i quattro modelli si adattano complessivamente bene

ai dati. Questo risultato conferma quelli dei test univariati della di Student.

t

D’altra parte, per la struttura stessa dell’ipotesi (2.4.17), si vede che affinché essa

sia respinta basta che anche uno solo dei primi coefficienti sia

k-1

significativamente diverso da zero. Questo significa che se anche uno solo dei

coefficienti diversi dall’intercetta ha una di Student significativa, ci dovremo

t

attendere che sia significativa (cioè che cada nella regione critica del test) anche la

. Nel caso in esame, in tutte e quattro le equazioni tutti i coefficienti presi

F

singolarmente sono molto significativi al test della , per cui l’esito del test della

t F

non fa altro che confermare questi risultati.

D’altra parte, questo non deve portare a pensare che l’informazione fornita dal

test congiunto sia ridondante, dato che l’analisi dei valori dei test della sui singoli

t

coefficienti non ci permette di stabilire quale modello sia complessivamente

superiore in termini di significatività. Ad esempio, dalle statistiche emerge che

F

l’equazione (2.3.19) è superiore alla (2.3.18), perché a parità di gradi di libertà la

seconda ha una statistica inferiore alla prima. A questo risultato non si può

pervenire consultando le singole dei coefficienti, tra l’altro anche perché queste si

t

riferiscono a variabili definite in modo diverso.

Osservazione 2.9 – La verifica nelle (2.3.17)-(2.3.20) della (2.4.19) porta

a un’uguaglianza approssimata, a causa degli arrotondamenti effettuati

nel riportare i coefficienti di determinazione. Ciò non pregiudica l’esito

del test, dato che le statistiche sono sensibilmente superiori ai valori

soglia. 2-27


PAGINE

29

PESO

269.13 KB

AUTORE

Atreyu

PUBBLICATO

+1 anno fa


DESCRIZIONE DISPENSA

Questo appunto tratta le ipotesi forti sui residui, come sviluppate nel corso di lezioni di econometria dal professor Francesco Carlucci. Nello specifico vengono trattati i temi: La funzione di densità congiunta, Intervalli di confidenza, ipotesi lineari multiple, La funzione di densità dello stimatore dei minimi quadrati.


DETTAGLI
Esame: Econometria
Corso di laurea: Corso di laurea in economia
SSD:
A.A.: 2007-2008

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher Atreyu di informazioni apprese con la frequenza delle lezioni di Econometria e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università La Sapienza - Uniroma1 o del prof Carlucci Francesco.

Acquista con carta o conto PayPal

Scarica il file tutte le volte che vuoi

Paga con un conto PayPal per usufruire della garanzia Soddisfatto o rimborsato

Recensioni
Ti è piaciuto questo appunto? Valutalo!

Altri appunti di Econometria

Modelli autoregressivi vettoriali
Dispensa
VAR di cointegrazione
Dispensa
Inferenza statistica
Dispensa
Identificazione e VAR strutturali
Dispensa