F. Carlucci – Traccia per un corso di Econometria
Modulo II – Minimi quadrati
3 VARIABILI DI COMODO E CAMBIAMENTI
STRUTTURALI
Indice del capitolo
3.1 Estensioni del modello lineare classico e test di malaspecificazione ......................2
3.2 Le variabili di comodo...........................................................................................5
Variabili di comodo per l’intercetta.................................................................5
Variabili di comodo per i coefficienti angolari .................................................8
Tendenze segmentate ......................................................................................8
Le osservazioni anomale .................................................................................9
Il test di normalità dei residui di Jarque e Bera............................................ 10
3.3 Variabili di comodo stagionali............................................................................. 16
La depurazione stagionale con il criterio dei minimi quadrati....................... 17
Stagionalità variabile ................................................................................... 20
Stagionalità additiva o moltiplicativa........................................................... 22
La conservazione dei volumi ......................................................................... 23
Destagionalizzazione in presenza della tendenza ........................................... 26
La serie destagionalizzata con la correzione della tendenza ........................... 27
La stima del modello con le serie destagionalizzate ....................................... 28
3.4 Un test di cambiamento strutturale per il modello lineare semplice.................... 32
Test di cambiamento di struttura con le variabili di comodo ......................... 34
3.5 Un test di cambiamento strutturale per il modello lineare multiplo .................... 40
Il test preliminare di uguaglianza delle varianze .......................................... 41
Test di invarianza strutturale per un sottoinsieme di parametri.................... 41
Test di cambiamento di struttura con le variabili di comodo ......................... 42
3.6 Bibliografia ........................................................................................................ 46
3-1
Modulo II – Minimi quadrati
3.1 Estensioni del modello lineare classico e test di
malaspecificazione
Possiamo riassumere ancora una volta le ipotesi alla base del modello lineare
esposte all’inizio del capitolo, presentandole per semplicità in forma scalare, cioè
con riferimento al modello di regressione semplice:
1 β β
1) il campione è omogeneo ed i parametri e sono
1 2
invariabili nel tempo;
2) i valori di sono noti, cioè non aleatori;
x t (3.1.1)
− ≠
3) 2
m x 0
xx ≠
0 t s
~ ~ ~
= ⋅ = ∀
4) ,
E (
u ) 0 E (
u u ) t,s
σ =
t t s 2
t s
~ σ
∼ ∀
5) 2
u N (
0 , ) t
t
L’ipotesi di non correlazione (4) insieme all’ipotesi di normalità (5) implica che i
residui del modello siano stocasticamente indipendenti. Queste due ipotesi possono
essere condensate nel modo seguente
~ σ (3.1.2)
∼ ∀t
2
u niid ( 0 , )
t
dove l’acronimo sta per
niid normally independently and identically distributed,
cioè identicamente e indipendentemente distribuite in modo normale.
2
Le (3.1.1) sono le cosiddette sul modello, sulle quali si
ipotesi stocastiche forti 3
basa, come abbiamo visto nel capitolo precedente, l’inferenza statistica nel modello
lineare classico. Buona parte dei capitoli successivi, a partire da questo, verrà
dedicata ad approfondire il significato di queste ipotesi. In particolare, ci interessa:
La loro espressione in termini matriciali è stata fornita nel capitolo 2.
1 Talora si impiega l’acronimo più sintetico omettendo la corrispondente a
nid, i identically
2 ∀t).
(che è ridondante, soprattutto se si specifica Dall’ipotesi di identica distribuzione
σ
scaturisce quella di costanza della varianza . Dall’ipotesi di indipendenza segue la non
2
correlazione, e quindi la nullità di tutte le covarianze secondo la (4) delle (3.1.1)
Alcuni autori considerano come “ipotesi stocastiche” solo le (4) e (5), poiché queste si
3
riferiscono direttamente ai residui, che sono l’unica componente esplicitamente stocastica
del modello. In effetti, anche la variabile dipendente è aleatoria (si veda la (1.6.2)), quindi
l’ipotesi di omogeneità del campione può essere ricompresa fra le ipotesi stocastiche.
Inoltre, l’ipotesi (2), che specifica la natura non aleatoria delle variabili esplicative, è essa
stessa un’ipotesi stocastica in quanto riferita alla natura del processo stocastico che genera
le .
x t 3-2
Modulo II – Minimi quadrati
1. comprendere se esse si prestano a rappresentare adeguatamente la realtà
economica
2. verificare con test statistici se esse siano o meno rispettate dai dati
3. investigare le proprietà statistiche del modello nel caso in cui esse non siano
verificate
4. studiare delle possibili estensioni o correzioni del modello che tengano conto
della violazione o dell’indebolimento delle ipotesi (3.1.1).
Ricordiamo che sia la nostra analisi delle proprietà della stimatore OLS, sia la
possibilità di effettuare inferenze statistiche su di esso, si basano sulle ipotesi
(3.1.1). Di conseguenza la violazione di una o più di esse ci impedisce di formulare
giudizi attendibili circa la significatività dei parametri del modello o di loro
combinazioni lineari.
Più precisamente, le ipotesi (3.1.1) dalla (1) alla (4) (dette ipotesi “deboli” o
“classiche” o “di Gauss-Markov”) sono alla base della non distorsione dello
stimatore OLS (1.6.17) e del teorema di Gauss-Markov (1.8.2), mentre tutte le
(3.1.1) prese congiuntamente (cioè le ipotesi forti) sono alla base dei teoremi
χ
distribuzionali visti nel capitolo 2, che ci consentono di effettuare test , e sui
2
t F
parametri del modello.
I test statistici con i quali si verifica se le ipotesi stocastiche forti sono o meno
rispettate dai dati vanno sotto il nome collettivo di o
test di malaspecificazione
diagnostici.
4
In questo capitolo ci occupiamo della prima fra le ipotesi elencate, quella che il
campione sia omogeneo e che quindi i parametri strutturali del modello siano
invariabili nel tempo. Ora, viceversa, ipotizziamo che uno o più di questi
5
parametri possano assumere valori diversi nel periodo campionario, in conseguenza
di non omogeneità del campione.
La non omogeneità può dipendere dal verificarsi, all’interno del campione, di
uno o più eventi eccezionali che determinano scostamenti della variabile
dipendente dal proprio valore teorico. Si parlerà in questo caso di osservazioni
In lingua inglese: o anche in quanto intendono
misspecification tests diagnostic tests,
4
diagnosticare eventuali “patologie” del modello, ovvero scostamenti dalle ipotesi stocastiche
sottostanti ad esso.
Più esattamente, in questa sezione concentriamo la nostra attenzion e sui coefficienti di
5 β. σ
regressione Anche la varianza è un parametro del modello, ma l’ipotesi della sua
2
costanza nel tempo verrà analizzata separatamente nel successivo capitolo 4. 3-3
Modulo II – Minimi quadrati
anomale, la cui presenza determina, in genere, asimmetrie e quindi non normalità
nella distribuzione dei residui. Questo argomento è affrontato nel paragrafo 3.2.
Una particolare forma di non costanza dei parametri si presenta nel caso di
andamenti stagionali delle variabili. Le oscillazioni determinate dal ciclo stagionale
si traducono in slittamenti dell’intercetta del modello, che quindi non è più
costante. I problemi legati alla stagionalità vengono introdotti nel paragrafo 3.3.
Una forma particolarmente interessante di non omogeneità è quella del
cambiamento di struttura, che si verifica quando il campione considerato abbraccia
un periodo storico all’interno del quale si sono manifestati due regimi
nell’andamento del fenomeno oggetto di studio, caratterizzati da due distinti
insiemi di parametri strutturali. Ciò può accadere, ad esempio, quando in tale
6
periodo sono presi provvedimenti istituzionali che modificano normativamente le
funzioni di comportamento: un’equazione che voglia spiegare un tasso di cambio
può avere caratteri diversi a seconda che si consideri il regime di cambi fissi oppure
quello di cambi flessibili, per cui occorre inserire nell’equazione stessa un
meccanismo che le permetta di valutare in maniera differenziata i due regimi. Un
altro caso riguarda il deposito previo cui sono costretti gli importatori in periodo di
forte disavanzo della bilancia dei pagamenti commerciale, per cui una equazione
delle importazioni deve discriminare tra dati rilevati in tempi in cui vige il deposito
previo e dati rilevati in tempi senza deposito. Un terzo esempio può concernere il
movimento dei capitali, la cui equazione deve poter tener conto di vincoli posti
dall’autorità monetaria in certi particolari periodi di tempo.
Nel paragrafo 3.2 vediamo come è possibile rappresentare per mezzo di variabili
di comodo la presenza di cambiamenti di struttura, mentre l’analisi effettuata nei
paragrafi 3.4 e 3.5 fornisce un primo insieme di strumenti statistici per valutare la
loro presenza all’interno del campione.
L’analisi può ovviamente estendersi al caso generale di cambiamenti di struttura.
r
6
L’interesse per questo tipo di non omogeneità è stato rafforzato dalla nota critica di Lucas,
secondo la quale i parametri strutturali dei modelli economici sono in effetti una mistura di
parametri “profondi”, rappresentanti le preferenze degli agenti economici, la tecnologia
prevalente nel sistema economico e il processo di formazione delle aspettative, per cui essi
sono soggetti a mutamenti ogni volta che gli agenti economici sono chiamati ad adattare il
proprio comportamento in risposta a mutamenti del quadro macroeconomico indotti, ad
esempio, da misure di politica economica. 3-4
Modulo II – Minimi quadrati
3.2 Le variabili di comodo
I meccanismi che vengono inseriti nelle equazioni affinché queste tengano conto dei
cambiamenti di regime fanno uso delle cosiddette e possono
variabili di comodo
essere anche complessi, in funzione dei tipi di influenza che le diverse strutture
economiche funzionanti nel periodo campionario producono sulla specificazione dei
modelli. In questo paragrafo vediamo come usare le variabili di comodo per
rappresentare cambiamenti di struttura nei parametri del modello (distinguendo
fra intercetta e coefficienti angolari), segmentazioni nella tendenza delle variabili,
e presenza di osservazioni anomale.
I meccanismi presentati in questa sezione possono essere facilmente estesi e
combinati per tener conto di cambiamenti di regime più complessi di quelli
considerati in queste pagine.
Variabili di comodo per l’intercetta
Supponiamo in primo luogo che i regimi diversi possibili siano due e che
influenzino soltanto l’intercetta: valgono allora i due modelli
= β + + β + β +
y x … x u
t 1 1t k−1 k−1t k t
nel regime I (ad esempio nei tempi con tasso di cambio fisso), e
t
= β + + β + β +
y x … x u
t 1 1t k−1 k−1t k+1 t
nel regime II (ad esempio nei tempi con tasso di cambio flessibile), che possono
t
essere riassunti nel seguente
= β + + β + β + β + (3.2.1)
y x … x d d u
t 1 1t k−1 k−1t k 1t k+1 2t t
dove
1 nel regime I 0 nel regime I
= =
d d
1t 2t
0 nel regime II 1 nel regime II
{d } {d }
In questo modo le serie storiche e sono composte da zero e da uno a
1t 2t
seconda dei tempi e non valgono mai contemporaneamente uno o zero. La matrice
t
è allora formata nel modo seguente
X =
X [X d d ]
1 1 2
= =
dove è la matrice delle , , , ed i vettori colonna e
X x i 1, 2, …, k−1 t 1, 2,…, n d
1 it 1
sono costituiti da zeri e da uno. L’equazione (3.2.1) può essere stimata con il
d
2 β =1,2,…,k−1
criterio dei minimi quadrati ordinari producendo stime per le , ,
i
i
β̂ β
ˆ
uguali nei due regimi, mentre l’intercetta vale nel regime I e nell’altro.
+
k k 1 3-5
Modulo II – Minimi quadrati
Le variabili e sono chiamate in quanto non derivano
di comodo
7
d d
1t 2t
direttamente da speculazioni teoriche ma vengono aggiunte nella specificazione
delle equazioni semplicemente per trattare periodi campionari con regimi
economici diversi. Nell’e sempio precedente se ne usano soltanto due, ma
evidentemente il loro numero dipende da quanti sono i regimi differenti da
considerare.
Il modello (3.2.1) deve essere stimato l’intercetta, che è sostituita dai due
senza
β β
valori alternativi e ; se si aggiungesse il termine noto, cui corrisponde nella
k k+1
matrice il vettore di uno , si avrebbe
i = +
i d d
1 2
cioè una colonna di sarebbe combinazione lineare delle altre, la matrice
X X
sarebbe singolare per il teorema IV-1.4 e non esisterebbe .
-1
(X′X)
Se si è costretti a stimare l’intercetta (ad esempio a causa di un programma di
calcolo automatico che la considera obbligatoriamente), è conveniente sostituire
all’equazione (3.2.1) la seguente
= β + + β + α + α + (3.2.2)
y x … x d u
t 1 1t k−1 k−1t 1 1t 2 t
che corrisponde alla prima se si pone in essa
α + α = β α = β (3.2.3)
,
1 2 k 2 k+1
α
ma contiene il termine noto .
2
3.1 – La (3.2.2) con le posizioni (3.2.3) è perfettamente
Osservazione
equivalente alla (3.2.1) nonostante contenga un diverso insieme di
parametri. Per questo motivo si dice, in termini tecnici, che la (3.2.3) è
ottenuta la (3.2.1), ovvero che è una
riparametrizzando
riparametrizzazione (o una diversa parametrizzazione) di quest’ultima.
La possibilità di esprimere la medesima equazione con
parametrizzazioni differenti torna molto utile nella teoria della verifica
delle ipotesi. Accade infatti spesso che un test di esecuzione
relativamente complessa diventi molto semplice riparametrizzando il
modello.
Sulle stime dei parametri associati con le variabili di comodo è utile effettuare il
test della di Student per verificare che siano diverse da zero. Se si accetta una
t
sola delle ipotesi nulle β = β = (3.2.4)
H : 0, H : 0
0 k 0 k+1
In lingua inglese: dummy.
7 3-6
Modulo II – Minimi quadrati
si conclude che durante uno dei regimi l’intercetta è nulla e quindi che vi è
differenza dall’altro, nel quale l’intercetta è significativamente diversa da zero.
D’altro canto, le due intercette possono differire l’una dall’altra essendo entrambe
diverse da zero, per cui è utile sottoporre a verifica l’ipotesi lineare
β −β = (3.2.5)
H : 0
0 k k+1
che può essere considerata come un caso particolare della (2.4.1). Si noti che nella
parametrizzazione (3.2.2) questa ipotesi si riduce alla seguente
α = (3.2.6)
H : 0
0 1
Se questa ipotesi è accettata non sussiste differenza tra i due regimi,
subordinatamente alla validità della rappresentazione (3.2.1).
3.2 – Possiamo ora esemplificare concretamente il fatto
Osservazione
che parametrizzazioni diverse rendono più o meno agevole l’esecuzione
di determinati test. Ad esempio, se si utilizza la parametrizzazione
(3.2.1) i due test (3.2.4) sono di immediata esecuzione (le loro statistiche
corrispondono ai rapporti dei rispettivi coefficienti), mentre con la
t
(3.2.2) solo il secondo dei test (3.2.4) non presenta difficoltà. Il primo,
invece, comporta che nella di Student si calcoli l’errore standard dato
t
da
σ α + α = σ α + α + α α =
1 / 2 1 / 2
ˆ ˆ ˆ ˆ ˆ ˆ
[
Var ( )] [
Var ( ) Var ( ) 2
Cov ( , )]
1 2 1 2 1 2 (3.2.7)
= σ + +
2 2 2 1 / 2
( a a 2 a )
+ + +
k k k 1 k 1 k k 1 σ
dove le sono gli elementi della matrice e è la radice
-1
2
a (i,j) (X′X)
ij
quadrata aritmetica della stima (1.7.2). Naturalmente, ove possibile il
ricercatore per eseguire la coppia di test (3.2.4) preferirà stimare il
modello (3.2.1).
D’altro canto, nella parametrizzazione (3.2.1) il test di uguaglianza dei
regimi viene espresso come (3.2.5) e quindi richiede l’uso di una
statistica , mentre nella (3.2.2) esso si riduce alla forma (3.2.6) per cui
F α
può essere effettuato semplicemente leggendo la di . In tal caso
t 1
quindi il ricercatore preferirà stimare il modello (3.2.2).
α
Il parametro della (3.2.2) misura lo spostame nto (in lingua inglese:
1 β β α
dell’intercetta nel regime I rispetto al regime II: . Per
shift) - =
k k+1 1
questo motivo la nel modello (3.2.2) viene detta shift dummy
d 1t
variable. 3-7
Modulo II – Minimi quadrati
Variabili di comodo per i coefficienti angolari
In un secondo meccanismo si suppone che due regimi diversi influenzino sia
&beta
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.