Che materia stai cercando?

Econometria - le variabili di comodo

Appunti di Econometria per l'esame del professor Carlucci sulle variabili di comodo e i cambiamenti strutturali. Gli argomenti trattati sono i seguenti: le estensioni del modello lineare classico e test di malaspecificazione, le variabili di comodo stagionali, il test di cambiamento strutturale per il modello lineare... Vedi di più

Esame di Econometria docente Prof. F. Carlucci

Anteprima

ESTRATTO DOCUMENTO

Modulo II – Minimi quadrati

si conclude che durante uno dei regimi l’intercetta è nulla e quindi che vi è

differenza dall’altro, nel quale l’intercetta è significativamente diversa da zero.

D’altro canto, le due intercette possono differire l’una dall’altra essendo entrambe

diverse da zero, per cui è utile sottoporre a verifica l’ipotesi lineare

β −β = (3.2.5)

H : 0

0 k k+1

che può essere considerata come un caso particolare della (2.4.1). Si noti che nella

parametrizzazione (3.2.2) questa ipotesi si riduce alla seguente

α = (3.2.6)

H : 0

0 1

Se questa ipotesi è accettata non sussiste differenza tra i due regimi,

subordinatamente alla validità della rappresentazione (3.2.1).

3.2 – Possiamo ora esemplificare concretamente il fatto

Osservazione

che parametrizzazioni diverse rendono più o meno agevole l’esecuzione

di determinati test. Ad esempio, se si utilizza la parametrizzazione

(3.2.1) i due test (3.2.4) sono di immediata esecuzione (le loro statistiche

corrispondono ai rapporti dei rispettivi coefficienti), mentre con la

t

(3.2.2) solo il secondo dei test (3.2.4) non presenta difficoltà. Il primo,

invece, comporta che nella di Student si calcoli l’errore standard dato

t

da

σ α + α = σ α + α + α α =

1 / 2 1 / 2

ˆ ˆ ˆ ˆ ˆ ˆ

[

Var ( )] [

Var ( ) Var ( ) 2

Cov ( , )]

1 2 1 2 1 2 (3.2.7)

= σ + +

2 2 2 1 / 2

( a a 2 a )

+ + +

k k k 1 k 1 k k 1 σ

dove le sono gli elementi della matrice e è la radice

-1

2

a (i,j) (X′X)

ij

quadrata aritmetica della stima (1.7.2). Naturalmente, ove possibile il

ricercatore per eseguire la coppia di test (3.2.4) preferirà stimare il

modello (3.2.1).

D’altro canto, nella parametrizzazione (3.2.1) il test di uguaglianza dei

regimi viene espresso come (3.2.5) e quindi richiede l’uso di una

statistica , mentre nella (3.2.2) esso si riduce alla forma (3.2.6) per cui

F α

può essere effettuato semplicemente leggendo la di . In tal caso

t 1

quindi il ricercatore preferirà stimare il modello (3.2.2).

α

Il parametro della (3.2.2) misura lo spostame nto (in lingua inglese:

1 β β α

dell’intercetta nel regime I rispetto al regime II: . Per

shift) - =

k k+1 1

questo motivo la nel modello (3.2.2) viene detta shift dummy

d 1t

variable. 3-7

Modulo II – Minimi quadrati

Variabili di comodo per i coefficienti angolari

In un secondo meccanismo si suppone che due regimi diversi influenzino sia

β

l’intercetta che il coefficiente angolare della variabile esplicativa . In

x

k−1 k-1,t

questo caso si ha

= β +…+ β + β + β + β

y x x (d x ) (d x ) d +

t 1 1t k−2 k−2,t k−1 1t k−1,t k 2t k−1,t k+1 1t (3.2.8)

β +

+ d u

k+2 2t t

con le variabili di comodo che hanno i significati precedenti. Con una procedura

analoga a quella sopra esposta, la (3.2.8) può essere sostituita dalla

= β +…+ β + + + α + α + (3.2.9)

y x x b d x b x d u

t 1 1t k−2 k−2,t 1 1t k−1,t 2 k−1,t 1 1t 2 t

che corrisponde alla (3.2.8) se si pone

α = β −α α = β = β −b = β

, , b , b

1 k+1 2 2 k+2 1 k−1 2 2 k

3.3 – Se nella (3.2.8) l’ordinamento temporale delle

Osservazione

variabili esplicative e delle non ha significato (ad esempio in dati

y

t

sezionali), tale equazione sintetizza le due

= β +…+ β + β + β +

y x x x u

t 1 1t k−2 k−2t k−1 k−1t k+1 t

= β +…+ β + β + β +

y x x x u

t 1 1t k−2 k−2t k k−1t k+2 t

ciascuna delle quali può essere stimata con i dati relativi ad un solo

regime economico.

Le intercette nei due regimi sono uguali se è valida l’ipotesi nulla

α =

H : 0

0 1 β β

mentre sono uguali i coefficienti angolari e se è valida l’altra

k−1 k

=

H : b 0

0 1

ipotesi che possono venire verificate nella (3.2.9) con il test della di Student.

t

Tendenze segmentate {y }

Talvolta l’ispezione visiva di una serie storica mostra chiaramente l’esistenza

t

di una tendenza che varia in due o più periodi di tempo per cui essa non può essere

rappresentata mediante una sola curva polinomiale del tipo (I-3.3.3). È necessario,

allora, fare uso delle variabili di comodo per distinguere tendenze diverse in periodi

diversi. Esemplifichiamo questo uso nel caso della tendenza lineare e di una coppia

di periodi; la generalizzazione al polinomio di grado generico ed a più di due

p

periodi è immediata.

Supponiamo, dunque, che si debba stimare una equazione che nel periodo I

valga 3-8

Modulo II – Minimi quadrati

= α + α + β′x +

y t u

t 0 1 t t

e nel periodo II valga = γ + γ + β′x +

y t u

t 0 1 t t

Se si opera con le differenze prime l’equazione diventa semplicemente

∆y = α + γ + β′∆x +

d d u

t 1 1t 1 2t t t

dove  

1 nel periodo I 0 nel periodo I

= =

 

d d

1t 2t

 

0 nel periodo II 1 nel periodo II

mentre se si desidera continuare ad avere l’equazione specificata sui livelli occorre

far uso di uno schema del tipo (3.2.6)

= α + γ + α + γ + β′x +

y d d (d t) (d t) u

t 0 1t 0 2t 1 1t 1 2t t t

2.2 – Se la tendenza è crescente nel periodo I e decrescente

Esempio α γ

nella II, si ha e . Se la tendenza è crescente in ambedue i

>0 <0

1 1 α γ

periodi ma con tassi di crescita diversi, e sono ambedue positivi ma

1 1

di valore diverso.

Le osservazioni anomale

Un uso molto frequente delle variabili di comodo è fatto nel trattamento dei dati

(o che, di nuovo, determinano la non omogeneità del

anomali eccezionali)

8

campione. Questi dati sono costituiti dalle osservazioni che nel campione sono

localizzate molto lontano dalla loro media, generalmente a causa di disomogeneità

repentine nel funzioname nto del sistema economico. Dati anomali nelle serie dei

prezzi possono, ad esempio, essere prodotti da shock petroliferi; altri nelle serie

della produzione industriale possono essere indotti da periodi prolungati di scioperi

massicci, e così via.

Questi dati possono provocare notevoli danni nella costruzione della parte

sistematica dei modelli econometrici. In particolare, in presenza di osservazioni

anomale non sarà generalmente più valida l’ipotesi di normalità dei residui. Le

osservazioni anomale comprese nel campione delle variabili endogene o di quelle

esogene, infatti, a meno che non compaiano in modo equivalente nelle prime e nelle

seconde, comportano elementi di squilibrio anche forte nella componente

sistematica delle equazioni e producono disturbi ben netti nella omogeneità dei

residui. La loro presenza si traduce quindi all’atto della stima in residui anomali,

cioè in episodi nei quali il modello sottostima o sovrastima notevolmente il

In lingua inglese: outliers.

8 3-9

Modulo II – Minimi quadrati

fenomeno che intende rappresentare. Se i residui anomali hanno tutti lo stesso

segno, la distribuzione dei residui sarà asimmetrica (positivamente o

negativamente) e quindi si allontanerà dalla normale, che è una distribuzione

simmetrica. Se invece i residui anomali si ripartiscono in modo

approssimativamente equo fra valori positivi e negativi, allora la distribuzione dei

residui sarà platicurtica, avrà cioè le code più “alte” della normale e di conseguenza

un coefficiente di curtosi maggiore di tre. Dato che le procedure di inferenza

9

studiate fin qui si basano sull’ipotesi stocastica forte di normalità dei residui, la

prima conseguenza della non normalità è appunto che i test di ipotesi sui

parametri del modello non daranno più risultati affidabili, almeno in piccoli

campioni.

10

Naturalmente la violazione dell’ipotesi di normalità non influisce sulle

proprietà dello stimatore OLS che non dipendono da essa. In particolare, sarà

sempre valido il teorema di Gauss-Markov (che richiede solo le ipotesi stocastiche

deboli) e quindi lo stimatore OLS sarà sempre un BLUE. Non sarà tuttavia

possibile effettuare inferenze affidabili su di esso.

Conviene pertanto eliminare gli effetti di disturbo delle osservazioni anomale

facendoli rappresentare da specifiche variabili di comodo che valgono uno nel

tempo in cui si manifesta l’osservazione anomala e zero negli altri tempi.

Ovviamente ad ogni dato considerato anomalo corrisponde una variabile di comodo,

per cui è necessario essere molto parsimoniosi nella loro valutazione per non

perdere, nella stima delle equazioni, troppi gradi di libertà.

Non sempre è possibile valutare a priori il carattere anomalo di alcuni dati nel

campione delle osservazioni, per cui ci si accorge di questa anomalia soltanto dopo

aver stimato le equazioni. Alla luce della discussione precedente gli strumenti

diagnostici che possono tornare utili a questo scopo sono due: un test di normalità

dei residui e l’analisi del grafico dei residui.

Il test di normalità dei residui di Jarque e Bera

Per illustrare il funzionamento del test di normalità richiamiamo i coefficienti di

asimmetria e di curtosi di una variabile aleatoria. Sia

κυρτοσ,

Il termine curtosi viene dal greco che significa “curvo” (lat. e indica

curvus)

9

appunto quanto è “arcuata” la distribuzione di probabilità. Il termine platicurtica è

πλατυ σ

composto con l’aggettivo che significa “piatto” e denota una distribuzione più

appiattita della normale (cioè con moda più bassa e code più alte). Il coefficiente di curtosi è

definito formalmente nel paragrafo XXI-(1.3).

Per i dettagli si veda Spanos [1986, par.21.2].

10 3-10

Modulo II – Minimi quadrati

µ r

= E( x-µ )

r µ σ

il momento centrale della variabile considerata, per cui è la

r-esimo 2

=

2

varianza della sua distribuzione. Il coefficiente di asimmetria è allora dato da

µ µ

γ =

= 3 3 (3.2.10)

1 σ 3

µ 3

2

e quello di curtosi da µ µ

β =

= 4 4 (3.2.11)

2 µ σ

2 4

2 γ

I test di normalità si basano sul fatto che in una distribuzione normale è = 0

1

β

(come in ogni distribuzione simmetrica) e inoltre (peculiarità questa della

= 3

2

sola normale). Per questo motivo il coefficiente di curtosi viene ridefinito

centrandolo sul valore che assume nella normale

γ β (3.2.12)

= – 3

2 2

Il coefficiente (3.2.12) viene definito “curtosi eccedente” ed è ovviamente nullo nel

caso della normale.

Il test sfrutta le controparti campionarie delle (3.2.10) e (3.2.12), date

rispettivamente da 1 ∑

n 3

ˆ

u

= t (3.2.13)

t 1

n

γ =

ˆ 1 3

 

1 ∑ 2

n

 

2

ˆ

u

= t

 

t 1

n

e 1 ∑

n 4

ˆ

u

= t (3.2.14)

t 1

n

γ = −

ˆ 3

2 2

 

1 ∑

n

 

2

u

ˆ

= t

 

t 1

n

Si dimostra che in campioni sufficientemente grandi i due coefficienti

campionari sono stocasticamente indipendenti e si distribuiscono in modo normale

 

6

γ  

ˆ ~ N 0 ,

1  

n (3.2.15)

 

24

γ  

ˆ ~ N 0 ,

2  

n 3-11

Modulo II – Minimi quadrati

Ne consegue che, sempre per campioni sufficientemente grandi, la statistica

ottenuta dalla somma delle (3.2.13) e (3.2.14) standardizzate con i rispettivi scarti

χ

quadratici medi ed elevate al quadrato si distribuisce come un con due gradi di

2

libertà (indichiamo questa statistica con le lettere , iniziali di Jarque e Bera, i

JB

due econometrici che hanno per primi proposto questo test )

11

n n

γ + γ χ (3.2.16)

2 2 22

ˆ ˆ

JB = ~

1 2

6 24 χ

Quando la statistica (3.2.16) eccede il valore soglia della distribuzione del , pari

22

α

a 5.99 al livello di significatività = 0.05, concludiamo che i residui sono non

normali, il che generalmente sarà dovuto alla presenza di una o più osservazioni

anomale. Histogram of Residuals and the Normal Density

20

15

Frequency 10

5

0 -0.1109 -0.07231 -0.03368 0.004951 0.04358 0.08221 0.1208

LNM

Figura 3.1– L’istogramma dei residui del modello (1.10.2) confrontato con la distribuzione

normale. Si noti l’asimmetria positiva dei residui.

Naturalmente la (3.2.16) non ci indica in quale periodo si verificano le

anomalie. Un’analisi attenta del grafico dei residui è pertanto necessaria al fine di

individuare i tempi delle anomalie e di neutralizzarne gli effetti. Euristicamente,

sotto l’ipotesi nulla di normalità dei residui, è possibile ritenere anomali i dati che

+2σ]

producono residui al di fuori dell’intervallo , poiché questi si

[−2σ,

verificheranno con probabilità molto piccola, inferiore al . Ovviamente questo

5%

intervallo di accettazione di osservazioni non anomale può esser ampliato o

ristretto in funzione delle opinioni del ricercatore.

Si veda Jarque e Bera [1980].

11 3-12

Modulo II – Minimi quadrati

Un altro utile strumento diagnostico è dato dall’istogramma dei residui, che

approssima la forma della distribuzione di probabilità di questi e quindi, se

confrontato con una distribuzione normale di varianza pari a quella dei residui

stimati, fornisce una indicazione sintetica delle cause di non normalità (ad

esempio, aiuta a stabilire se questa è determinata da asimmetria – poche

osservazioni anomale dello stesso segno – o da eccesso di curtosi – molte

osservazioni anomale di entrambi i segni).

0.10

0.08

0.06

0.04

0.02

0.00

-0.02

-0.04

-0.06

-0.08

1970Q1 1975Q1 1980Q1 1985Q1

1972Q3 1977Q3 1982Q3 1987Q3

Trimestri

Figura 3.2 – I residui OLS del modello 1.10.2. Il grafico riporta la banda di ampiezza 4σ

centrata sullo zero. L’asimmetria positiva di essi è rivelata dalla presenza di tre residui

anomali positivi, contro uno solo negativo (cfr. la figura 1.5).

Applichiamo ora questi concetti all’equazione delle importazioni (1.10.1), le cui

stime sono riportate nella (1.10.2). Vale la pena di sottolineare che utilizziamo il

modello non vincolato (1.10.1) perché i test per le ipotesi di uguaglianza delle

elasticità e di omogeneità di grado zero nei prezzi, condotti nel paragrafo 2.4,

respingono le rispettive ipotesi nulle, suggerendo quindi che le stime vincolate

presentate nel paragrafo 1.11 sono inappropriate. Naturalmente se i residui

risultassero non normali il risultato di questi test andrebbe revocato in dubbio.

Una corretta prassi vorrebbe quindi che essi venissero reiterati dopo aver

individuato e corretto la causa della non normalità.

Il test di normalità (3.2.16) sui residui della (1.10.2) dà una statistica pari a

6.92, superiore al valore soglia. Concludiamo che i residui sono non normali. Il loro

istogramma è riportato nella figura 3.1 che lo confronta con una distribuzione

normale di pari varianza. La distribuzione dei residui è positivamente

asimmetrica. L’asimmetria è determinata in particolare da alcune osservazioni

3-13

Modulo II – Minimi quadrati

anomale attorno a 0.08. Per individuare la data nella quale si realizzano

consultiamo il grafico dei residui della (1.10.2), già visto nella figura 1.4, che

riportiamo nella figura 3.2 insieme alle relative bande di confidenza date da più e

meno due scarti quadratici medi.

Il grafico conferma l’asimmetria positiva dei residui (ci sono tre residui

maggiori di contro uno solo minore di ) e indica che l’osservazione anomala

2σ -2σ

più marcata si verifica nel primo trimestre del 1973. Stimiamo quindi nuovamente

il modello (1.10.1) aggiungendo la variabile che vale 1 nel primo trimestre del

d

73,t

1973 e zero altrove. Formalmente, questa variabile può essere definita utilizzando

la funzione indicatore di un evento, cioè la funzione che vale 1 se l’evento

I(.)

specificato fra parentesi è vero e zero in caso contrario. Nel nostro caso quindi

(3.2.17)

d = I( t=1973:1 )

73,t

Histogram of Residuals and the Normal Density

20

15

Frequency 10

5

0 -0.1012 -0.06637 -0.03155 0.003265 0.03808 0.0729 0.1077

LNM

Figura 3.3 –L’istogramma dei residui della (3.2.19).

Aumentando la (1.10.1) con la variabile definita dalla (3.2.17) otteniamo il

modello: = β β β β β δ

+ + + + + (3.2.18)

lny lnx lnx lnx lnx d + u

73,t

1 2 1 3 2 4 3 5 4

t t t t t t

δ

dove La stima della (3.2.18) fornisce i

è il coefficiente della variabile di comodo.

seguenti risultati

^ = −

ln y -6.08 + 0.570 lnx + 0.908 lnx 0.156 lnx + 0.097 lnx

t 1t 2t 3t 4t (3.2.19)

(-6.6) (7.1) (23.9) (-8.6) (3.3) 3-14

Modulo II – Minimi quadrati

+ 0.096 d 73,t

(3.4) = = =

2 2

n = 80, R 0.986, R = 0.985, RSS 0.054, SEE 0.027, JB = 2.07

c

Il coefficiente della variabile di comodo è significativo, con una pari a 3.4, e la

t

statistica del test di normalità scende ora a 2.07, all’interno della regione di

accettazione. La correzione sembra quindi aver avuto successo. Si noti che il

coefficiente di determinazione corretto è aumentato rispetto alla (1.10.2).

L’istogramma dei residui della (3.2.19) è riportato nella figura 3.3 e appare ora

più simmetrico. Il grafico dei residui (figura 3.3) mostra il permanere di alcune

osservazioni al di fuori della banda di confidenza. Tuttavia esse non sono tali da

indurre una significativa asimmetria dei residui (il test non rifiuta) e quindi si

JB

può presumere che non influenzino le proprietà del modello.

Plot of Residuals and Two Standard Error Bands

0.10

0.08

0.06

0.04

0.02

0.00

-0.02

-0.04

-0.06 1989Q4

1970Q1 1973Q4 1977Q3 1981Q2 1985Q1 1988Q4

Quarters

Figura 3.4 – Il grafico dei residui della (3.2.19).

Possiamo ora ripetere i test per le ipotesi di uguaglianza delle elasticità e di

omogeneità di grado zero nei prezzi. Ad esempio, la devianza dei residui nel

β β

modello con il vincolo e la dummy puntuale è pari a 0.063, per cui

H : =

0 2 3

applicando la prima delle (2.5.4) otteniamo

0 .

063 0 . 054 74 = 12

. 3

0 . 054 1

da confrontare con il valore soglia di una che al livello 0.05 è pari a 3.8. Di

F 1,74

conseguenza l’ipotesi di uguaglianza delle elasticità viene respinta anche dopo aver

corretto le osservazioni anomale e ripristinato la normalità dei residui. 3-15

Modulo II – Minimi quadrati

3.3 Variabili di comodo stagionali

Le variabili di comodo possono essere utilmente adoperate nella cosiddetta

Per motivare ed illustrare questa procedura osserviamo

depurazione stagionale.

che gran parte dei fenomeni economici posseggono un andamento cioè

stagionale,

una conformazione di diminuzioni ed aumenti di valore che si ripetono in misura

simile ogni anno per cause diverse, ad esempio la preferenza o l’abitudine dei

lavoratori a concentrare le ferie in uno stesso periodo, il degli

window dressing

istituti di credito che produce un incremento dei depositi nel mese di dicembre, o

anche la convenienza che alcuni operatori della distribuzione sembrano avere

nell’aumentare i prezzi dei prodotti distribuiti in particolari periodi dell’anno. Nel

primo esempio si ha una configurazione stagionale nelle serie della produzione, nel

secondo una nelle serie dei depositi bancari, nel terzo l’andamento stagionale nei

prezzi. Autocorrelation function of residuals, sample from 1970Q1 to 1989Q4

1.0

0.8

0.6

0.4

0.2

0.0

-0.2

-0.4 1818

0 2 4 6 8 10 12 14 16

Order of lags

Figura 3.5 – Il correlogramma dei residui del modello (3.2.19).

La presenza delle stagionalità nelle osservazioni campionarie può distorcere

notevolmente la significatività delle equazioni che vengono stimate. Se è stagionale

la variabile endogena ma questo carattere non è rappresentato dall’insieme delle

esogene, accade che la configurazione stagionale venga trasferita sui residui, che

quindi presentano una correlazione nonnulla quattro se le

al ritardo stagionale:

serie storiche adoperate sono trimestrali, dodici se le serie sono mensili. In altre

parole la ripetizione annuale delle diminuzioni e degli aumenti di valore, che

equivale ad una periodicità di quattro o di dodici unità temporali a seconda della

cadenza delle serie storiche campionarie, si traduce in una covarianza nonnulla dei

3-16

Modulo II – Minimi quadrati

residui intervallati di quattro o di dodici tempi. La terza delle ipotesi deboli (1.6.10)

sui residui viene quindi a cadere.

A titolo di esempio si osservi nella figura 3.5 il correlogramma dei residui

dell’equazione (3.2.19), rappresentati a loro volta nella figura 3.4. Il correlogramma

3.5 presenta un picco a tutti i ritardi stagionali (cioè ai ritardi multipli interi della

cadenza stagionale, che per dati trimestrali è uguale a quattro) e rende quindi

evidente un fenomeno che già l’osservazione diretta del grafico 3.4 lascia intuire,

ovvero l’esistenza di cicli stagionali nei residui. Questo fenomeno è prevedibile. La

figura 1.3 infatti mostra che le variabili coinvolte nella stima hanno tutte una

marcata stagionalità, ma il profilo di questa stagionalità differisce dall’una

all’altra: ad esempio, la serie dei consumi ha un andamento più livellato di quella

delle importazioni e degli investimenti. Queste differenze si scaricano sul residuo

dell’equazione, determinandone la stagionalità.

Può, d’altro canto, succedere che la conformazione stagionale dell’endogena sia

ben rappresentata da un carattere analogo presentato dalla parte sistematica

dell’equazione. In questo caso i residui posseggono covarianze nulle ai ritardi

stagionali ma può sussistere il problema che la significatività dell’equazione sia in

gran parte (o totalmente) dovuta proprio alle stagionalità simili presenti nella

variabile endogena e nell’insieme delle esogene. La bontà della relazione stimata

viene quindi, in questa situazione, a dipendere dalle caratteristiche stagionali e

non da una effettiva associazione economica.

La depurazione stagionale con il criterio dei minimi quadrati

Per ovviare a questi problemi è necessario le serie campionarie delle

depurare

stagionalità prima di utilizzarle nella costruzione di equazioni econometriche. Per

{y }

eliminare le stagionalità nella serie storica si può aggiungere ai suoi elementi

t

una costante che varia da trimestre a trimestre o da mese a mese a seconda della

b

cadenza: a titolo esemplificativo, nel primo caso si ha

= + d

y b y

1 1 1

= + d

y b y

2 2 2

= + d

y b y (3.3.1)

3 3 3

= + d

y b y

4 4 4

= + d

y b y

5 1 5

...

con le quattro costanti che si ripetono ogni anno. La variabile con l’indice non

d

{ }

presenta più stagionalità e forma la serie se vale l’ipotesi di

destagionalizzata d

y t { }

configurazione stagionale costante nel tempo; se la stagionalità è variabile la d

y t

è destagionalizzata soltanto approssimativamente. 3-17

Modulo II – Minimi quadrati

Utilizzando quattro variabili di comodo (stagionali) , le (3.3.1)

d , d , d , d

1t 2t 3t 4t

possono essere definite tramite l’equazione

= + + + + (3.3.2)

d

y b d b d b d b d y

t 1 1

t 2 2 t 3 3 t 4 4 t t

con  = + + (3.3.3)

1 t i

, i 4 , i 8 ,...

= =

d i 1

, 2 , 3

, 4

≠ + +

it  0 t i

, i 4 , i 8

,...

La (3.3.2) può essere scritta nella forma compatta

= + (3.3.4)

d

y Sb y = ′

dove è il vettore delle destagionalizzate, è il vettore dei fattori

d d

y y b [b b b b ]

1 2 3 4

e la matrice di ordine è formata dalle quattro

di destagionalizzazione S n×4

variabili di comodo  

1 0 0 0

 

0 1 0 0

 

 

0 0 1 0

 

=

S 0 0 0 1

  (3.3.5)

 

1 0 0 0

 

 

0 1 0 0

 

 

... ... ... ...

3.4 - A causa della presenza delle variabili di comodo,

Osservazione

nella (3.3.2) manca l’intercetta. Se la si volesse inserire, le variabili di

comodo sarebbero soltanto tre.

Ovviamente, se la cadenza dei dati è mensile, le variabili di comodo nella (3.3.2)

sono dodici e l’ordine della matrice è .

S n×12

La stima di è facilmente ottenuta utilizzando il criterio dei minimi quadrati

b { }

ordinari sull’equazione (3.3.2) dove la serie dei residui costituisce la variabile

d

y t

destagionalizzata e dove l’intercetta è data dall’insieme dei coefficienti delle

variabili di comodo; considerando la (3.3.4) si ha

−1

= ′ ′

ˆ

b ( S S ) S y

per cui (3.3.6)

−1

= − = − ′ ′ =

ˆ

d

y

ˆ y S b y S (

S S ) S y My

dove 3-18

Modulo II – Minimi quadrati

′ ′

−1

= − (3.3.7)

M I S (

S S ) S

Queste ultime due relazioni indicano che la serie destagionalizzata è ottenuta come

{y }

combinazione lineare, mediante la matrice , delle serie originale .

M t

La matrice è del tipo (1.7.4), quindi simmetrica ed idempotente; si vede,

M

inoltre, immediatamente che = 0 (3.3.3)

MS

L’idempotenza di è una caratteristica interessante della depurazione

M

stagionale operata con variabili di comodo, poiché permette di stabilire che tale

procedura è ininfluente se eseguita su di una serie già destagionalizzata; infatti, se

questa è , si ha

My = = (3.3.9)

d

y

ˆ M (

My

) My

40000

35000

30000

25000

20000

15000

10000

1970Q1 1972Q3 1975Q1 1977Q3 1980Q1 1982Q3 1985Q1 1987Q3

M Fitted

Figura 3.6 – La serie storica non destagionalizzata delle importazioni di beni e servizi a

prezzi 1980 e la stima dei fattori di destagionalizzazione effettuata con la (3.3.2).

A titolo di esempio, possiamo destagionalizzare con la (3.3.4) la serie storica

delle importazioni, che costituisce la variabile dipendente della (3.2.18) ed è già

stata rappresentata nella figura 1.2. Stimando la (3.3.2) otteniamo

^ =

y 22189.7 d + 22568.7 d + 20966.5 d + 23567.8 d

t 1t 2t 3t 4t

(18.8) (19.1) (17.7) (19.9)

= = =

2 2

n = 80, R 0.031, R = -0.006, RSS 2.12E+09, SEE 5275.8, JB = 6.79

c

Si noti che tutti i fattori di destagionalizzazione sono fortemente significativi,

anche se la bontà complessiva del modello è scarsa, con un coefficiente di

3-19

Modulo II – Minimi quadrati

determinazione corretto addirittura negativo. Questo è un risultato ovvio e non

preoccupante, essendo determinato dal fatto che la (3.3.4) si propone di catturare

solo un aspetto della serie, cioè la sua stagionalità. Di conseguenza, se il contributo

di questa alla variabilità complessiva della serie è relativamente piccolo, come

accade per serie dotate di forte tendenza, la devianza non spiegata dalla (3.3.4)

sarà relativamente grande e il coefficiente di determinazione piccolo.

La figura 3.6 propone il grafico dei valori storici e di quelli stimati, che

costituiscono una stima delle stagionalità della serie. Il residuo stimato, che

corrisponde alla serie destagionalizzata, è rappresentato nella figura 3.7. Il

confronto con la figura 3.6 rende evidente come l’applicazione della (3.3.4) abbia in

effetti contribuito a livellare alquanto il profilo stagionale della serie.

15000

10000

5000

0

-5000

-10000

-15000

1970Q1 1972Q3 1975Q1 1977Q3 1980Q1 1982Q3 1985Q1 1987Q3

Figura 3.7 – La serie storica delle importazioni di beni e servizi a prezzi 1980

destagionalizzata con i fattori stimati mediante la (3.3.2) mostrati nella precedente figura

3.6.

Stagionalità variabile

In molti casi gli effetti della stagionalità, sia pure periodici, non sono costanti nel

tempo ma variano, ad esempio aumentando o diminuendo il modo lineare. Questo

fenomeno si presenta con grande frequenza nel caso di serie storiche espresse in

termini nominali, la cui variabilità, anche stagionale, aumenta nel tempo per

effetto dell’inflazione. La figura 3.8 esemplifica questo andamento con riferimento

alla serie dell’indice dei salari nominali nel settore manifatturiero in Italia (dati

trimestrali grezzi dal 1979:1 al 1988:4).

In questo caso la (3.3.2) deve essere sostituita con l’equazione seguente

= α + α + α + α + α + α + α + α + (3.3.10)

d

y b ( t )

d b ( t )

d b ( t ) d b ( t ) d y

t 1 0 1 1

t 2 0 1 2 t 3 0 1 3 t 4 0 1 4

t t 3-20

Modulo II – Minimi quadrati

nella quale si vede chiaramente come i fattori di destagionalizzazione varino

linearmente ne l tempo con lo stesso andamento.

400

300

200

100

0

1979Q1 1980Q2 1981Q3 1982Q4 1984Q1 1985Q2 1986Q3 1987Q4

Quarters

Figura 3.8 - L’indice dei salari nominali nel settore manifatturiero in Italia (dati trimestrali

grezzi dal 1979:1 al 1988:4). Si tratta di un tipico caso di serie con ciclo stagionale di

ampiezza crescente.

La (3.3.10) può essere scritta nel modo

4 4

∑ ∑

= β + γ + d (3.3.11)

y d q y

t i it i it t

= =

i 1 i 1

dove le variabili di comodo sono ancora definite dalla (3.3.3) e le altre dalla

d q

it it

= =1, (3.3.12)

q t⋅d i 2, 3, 4

it it

Per stimare i fattori di destagionalizzazione nella (3.3.11) si può utilizzare

ancora il criterio dei minimi quadrati applicati alla forma (3.3.4) nella quale ora

= β β β β γ γ γ γ e la matrice di ordine è data da

b [ ] S n×8

1 2 3 4 1 2 3 4

 

1 0 0 0 1 0 0 0

 

0 1 0 0 0 2 0 0

 

 

0 0 1 0 0 0 3 0 (3.3.13)

 

=

S 0 0 0 1 0 0 0 4

 

 

1 0 0 0 5 0 0 0

 

 

0 1 0 0 0 6 0 0

 

 

... ... ... ... ... ... ... ... 3-21

Modulo II – Minimi quadrati

Nel caso della serie dei salari rappresentata nella figura 3.8 la procedura di

destagionalizzazione con la (3.3.11) fornisce la serie rappresentata nella figura 3.9.

Plot of Residuals and Two Standard Error Bands

50

40

30

20

10

0

-10

-20

-30

-40

-50 1988Q4

1979Q1 1980Q2 1981Q3 1982Q4 1984Q1 1985Q2 1986Q3 1987Q4

Quarters

Figura 3.9 – L’indice dei salari nominali della figura 3.8 destagionalizzato con la (3.3.11).

Stagionalità additiva o moltiplicativa

Nella (3.3.2) i fattori di destagionalizzazione sono nel senso che

additivi

aggiungono o sottraggono ad una quantità variabile a seconda della sua

y

t

conformazione stagionale. In alcune circostanze, tuttavia, è più conveniente

rappresentarli nella forma che ritorna ad essere del tipo (3.3.2) se si

moltiplicativa,

prendono i logaritmi dei due membri

= (3.3.14)

d d d d d

y b b b b y

1

t 2 t 3 t 4 t

t 1 2 3 4 t

La generalizzazione della stagionalità moltiplicativa al caso variabile del punto

precedente è lasciata al lettore.

È interessante osservare che il modello moltiplicativo fornisce una

rappresentazione più parsimoniosa, ma spesso ugualmente valida, delle

stagionalità variabili. Ciò deriva dal fatto che la trasformazione logaritmica,

“schiacciando” in modo più che proporzionale i valori più elevati, contribuisce a

stabilizzare la varianza della serie, e quindi anche quella del suo ciclo stagionale. A

titolo di esempio si osservi, nella figura 3.10, il grafico del logaritmo dell’indice dei

salari nominali grezzi rappresentato nella figura 3.8. La serie logaritmizzata ha

stagionalità di ampiezza stabile, le quali quindi si prestano ad essere rappresentate

mediante il modello (3.3.2), che ora diventa

= + + + +

ln d

y b d b d b d b d y

t 1 1

t 2 2 t 3 3 t 4 4 t t 3-22

Modulo II – Minimi quadrati

anziché con il più complicato (3.3.11). Ma prendendo gli antilogaritmi dell’ultima

formula otteniamo appunto il modello moltiplicativo (3.3.14).

6.0

5.5

5.0

4.5

4.0

1979Q1 1980Q2 1981Q3 1982Q4 1984Q1 1985Q2 1986Q3 1987Q4

Quarters

Figura 3.10 – Il logaritmo dell’indice dei salari nominali grezzi rappresentato nella figura

3.8. È evidente come la trasformata logaritmica stabilizzi la varianza del ciclo stagionale. Di

converso, ciò significa che le stagionalità della variabile in unità naturali possono essere

rappresentate adeguatamente dal modello moltiplicativo (3.3.14).

Stimando il modello (3.3.2) con i logaritmi dei salari nominali grezzi otteniamo

^ =

ln y 4.92 d + 5.05 d + 5.04 d + 5.27 d

t 1t 2t 3t 4t

(39.9) (41.0) (40.9) (42.8)

= = =

2 2

n = 80, R 0.105, R = 0.030, RSS 5.46, SEE 5.07, JB = 3.13

c

e i relativi valori destagionalizzati sono rappresentati nella figura 3.11, dalla quale

si vede che il modello moltiplicativo contribuisce a livellare, ma non elimina del

tutto, le ciclicità stagionali.

La conservazione dei volumi { }

In effetti, non è conveniente utilizzare come serie destagionalizzata se la sua

d

ŷ t

media è diversa da zero oppure se essa possiede una tendenza. Nel primo caso,

n n

∑ ∑

= ≠ =

infatti, pur se , si ha che in virtù della (1.4.18) e

d

ˆ

y / n y 0 y 0

t t

= =

t 1 t 1

considerando che i coefficienti delle variabili di comodo formano l’intercetta. Questo

azzeramento della somma dei dati destagionalizzati è un difetto della procedura

3-23

Modulo II – Minimi quadrati

poiché per ragioni di contabilità è generalmente utile che la somma dei dati

destagionalizzati coincida con la somma dei dati originali (conservazione dei

si usa porre, allora,

volumi); = + (3.3.15)

c d

ˆ ˆ t = 1, 2, …, n

y y y

t t

ottenendosi una serie che al tempo stesso è destagionalizzata e conserva i volumi.

0.8

0.6

0.4

0.2

0.0

-0.2

-0.4

-0.6

-0.8

1979Q1 1981Q3 1984Q1 1986Q3

Figura 3.11 – La serie storica dei salari nominali (in logaritmi) destagionalizzata col

modello moltiplicativo.

40000

35000

30000

25000

20000

15000

10000

1970Q1 1972Q3 1975Q1 1977Q3 1980Q1 1982Q3 1985Q1 1987Q3

M MDEST

Figura 3.12 – La serie delle importazioni destagionalizzata con la conservazione dei volumi.

3-24

Modulo II – Minimi quadrati

La figura 3.12 rappresenta la serie storica delle importazioni destagionalizzata

e trasformata con la (3.3.15).

40000

30000

20000

10000

0

-10000 1989Q4

1970Q1 1972Q3 1975Q1 1977Q3 1980Q1 1982Q3 1985Q1 1987Q3

Figura 3.13 – Il grafico dei valori storici e stimati delle importazioni ottenuti con il modello

(3.3.17). I valori stimati coincidono in questo caso con il ciclo stagionale centrato sullo zero,

in virtù delle proprietà delle variabili di comodo centrate (3.3.16). Sottraendo ai valori

storici questa stima centrata del ciclo stagionale si ottiene una serie destagionalizzata che

conserva i volumi (si veda la figura 3.14).

Lo stesso risultato di conservazione dei volumi si ottiene utilizzando al posto

delle variabili di comodo definite dalla (3.3.3) quelle centrate, definite come

 = + +

0 . 75 t i

, i 4 , i 8 ,...

= =

d (3.3.16)

i 1

, 2

, 3

, 4

− ≠ + +

it  0 . 25 t i

, i 4 , i 8

,...

Le si ottengono sottraendo alle la loro media, che nel caso il campione

d

d it

it

comprenda un numero intero di anni è pari a 0.25. Si noti che ognuna delle è

d

( ) it

= − + +

perfettamente collineare alle altre tre. Si ha, ad esempio, . Di

d d d d

1

t 2 t 3 t 4 t

conseguenza solo tre delle possono essere inserite contemporaneamente in una

d it

regressione e la (3.3.2) diventa

= + + + (3.3.17)

c

ˆ

y b d b d b d y

t 1 1 t 2 2 t 3 3 t t

dove ora il residuo conserva i volumi, dato che le variabili di comodo, essendo

centrate, non sottraggono alla la propria media campionaria.

y

t

Nel caso delle importazioni la stima del modello con variabili di comodo (3.3.17)

centrate fornisce i seguenti risultati 3-25

Modulo II – Minimi quadrati

^ =

y -1378.1 - 999.1 - 2601.3

d d d

t 1t 2t 3t

(-0.1) (-0.1) (-0.3)

= = =

2 2

n = 80, R -18.2, R = -18.1, RSS 4.20E+10, SEE 23349.8, JB = 55.74

c

Il grafico dei valori storici e stimati è riportato nella figura 3.13 e da esso

risulta evidente che la (3.3.17) fornisce una stima del ciclo stagionale centrata sullo

zero. Sottraendo questa stima alla serie originale otteniamo il residuo della

(3.3.17), cioè la serie destagionalizzata che conserva i volumi (la stessa

rappresentata nella figura 3.12).

Destagionalizzazione in presenza della tendenza

Nel secondo caso citato all’inizio del punto precedente, ovvero quando la variabile

possiede una tendenza, sussiste il difetto di una distorsione delle stime dei fattori

di destagionalizzazione indotta dalla presenza della tendenza nella serie originale.

Infatti, sempre nel caso della cadenza trimestrale dei dati, facilmente estendibile a

quello della cadenza mensile, se è multiplo di 4, come accade generalmente, si ha

n

=

S [I I … I ]′

4 4 4

= + + = =

S′S [I I I I …+ I I ] <n/4 , n/4 , n/4 , n/4> (n/4)⋅I

4 4 4 4 4 4 4

per cui 4 ′

= ⋅ =

ˆ

b [

I I ...

I ]

y [ y y y y ]

4 4 4 1 2 3 4

n

=1,2,3,4

dove , , indica la media aritmetica delle relative al solo trimestre

y i y

t

i

-esimo. In tale maniera, la presenza della tendenza nella serie originale aumenta

i

di per sé i valori dei fattori stagionali man mano che si passa dal primo al quarto,

se è crescente; li diminuisce se decrescente.

Per depurare correttamente una serie delle stagionalità, allora, è necessario

eliminare anche la tendenza; ad esempio, mediante un polinomio del tipo (I-2.8.3).

Combinando questo e la (3.3.2) si ottiene

= + + + + + + + + (3.3.18)

2 p *

y a t a t ... a t b d b d b d b d y

t 1 2 p 1 1 t 2 2 t 3 3

t 4 4 t t

{ }

dove è la serie depurata sia della tendenza che delle stagionalità. Si osservi

*

ˆ

y t

che nella (3.3.18) è stato tolto il termine di grado zero in a causa della presenza

t

delle variabili di comodo.

Scrivendo la (3.3.18) per tutte le si ottiene, in forma sintetica

t

= + + *

y Pa Sb y

dove e

a=[a a … a ]

1 2 p 3-26


PAGINE

46

PESO

185.67 KB

PUBBLICATO

+1 anno fa


DESCRIZIONE APPUNTO

Appunti di Econometria per l'esame del professor Carlucci sulle variabili di comodo e i cambiamenti strutturali. Gli argomenti trattati sono i seguenti: le estensioni del modello lineare classico e test di malaspecificazione, le variabili di comodo stagionali, il test di cambiamento strutturale per il modello lineare semplice, il test di cambiamento strutturale per il modello lineare multiplo.


DETTAGLI
Esame: Econometria
Corso di laurea: Corso di laurea in economia
SSD:
A.A.: 2013-2014

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher valeria0186 di informazioni apprese con la frequenza delle lezioni di Econometria e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università La Sapienza - Uniroma1 o del prof Carlucci Francesco.

Acquista con carta o conto PayPal

Scarica il file tutte le volte che vuoi

Paga con un conto PayPal per usufruire della garanzia Soddisfatto o rimborsato

Recensioni
Ti è piaciuto questo appunto? Valutalo!

Altri appunti di Econometria

Modelli autoregressivi vettoriali
Dispensa
VAR di cointegrazione
Dispensa
Inferenza statistica
Dispensa
Identificazione e VAR strutturali
Dispensa