Francesco Carlucci – Traccia per un corso di Econometria
Modulo II – Minimi quadrati
1 IL MODELLO LINEARE GENERALE
Indice del capitolo
1.1 Serie storiche, dati sezionali e longitudinali..........................................................2
Dati longitudinali...........................................................................................3
1.2 Il criterio dei minimi quadrati ..............................................................................4
1.3 I minimi quadrati nel modello lineare semplice ....................................................7
Le stime dei minimi quadrati nel modello lineare semplice..............................7
1.4 I minimi quadrati nel modello lineare multiplo................................................... 11
La condizione necessaria per i minimi quadrati e le equazioni normali ......... 13
L’ortogonalità dei residui rispetto alle variabili esplicative............................ 14
Un esempio: il modello lineare semplice in termini matriciali........................ 15
La condizione sufficiente per i minimi quadrati ............................................ 16
1.5 La scomposizione della devianza ed il coefficiente di determinazione .................. 18
Il coefficiente di determinazione in termini matriciali ................................... 19
Il coefficiente di determinazione corretto ....................................................... 20
Il coefficiente di determinazione per il modello con le variabili scarto ............ 21
1.6 I residui come enti aleatori: le ipotesi deboli ....................................................... 24
Lo stimatore dei minimi quadrati per il modello lineare semplice.................. 27
Lo stimatore dei minimi quadrati per il modello lineare multiplo .................. 29
1.7 La stima della varianza dei residui ..................................................................... 32
La distorsione della varianza campionaria ................................................... 32
1.8 Il teorema di Gauss-Markov e gli stimatori BLU ................................................ 35
1.9 La matrice di correlazione degli stimatori dei parametri di regressione .............. 37
1.10 La stima dei minimi quadrati di una funzione delle importazioni ....................... 39
1.11 Il criterio dei minimi quadrati vincolati .............................................................. 44
La stima dei minimi quadrati vincolati ........................................................ 45
Le stime dei minimi quadrati vincolati per una funzione delle importazioni .. 48
Il vincolo di omogeneità di grado zero sui prezzi............................................ 50
Il doppio vincolo dell’uguaglianza delle elasticità e dell’omogeneità sui prezzi
..................................................................................................................... 50
1.12 Riferimenti bibliografici...................................................................................... 53
18/03/03; 18.20 Edizione 2.1
Modulo II – Minimi quadrati
1.1 Serie storiche, dati sezionali e longitudinali
Fin dall’inizio è stata presa in considerazione la semplice funzione del consumo di
derivazione keynesiana (I-2.1.1) nella quale consumo e reddito, legati da una
relazione lineare, possono essere riferiti ad istanti differenti di tempo,
, oppure ad unità di consumo e di reddito (ad esempio famiglie),
t = 1, 2, …, n , considerate allo stesso tempo . Si possiede, allora, nel primo caso un
i = 1, 2, …, N t
di osservazioni che formano
campione serie storiche
= α + β (1.1.1)
c y t = 1, 2, …, n
t t
mentre nel secondo le osservazioni compongono .
dati sezionali
1
= α + β (1.1.2)
c y i = 1, 2, …, N
i i
Un campione temporale di può essere costruito mediante indagini
ampiezza n
che si protraggono nel tempo, oppure tramite una disaggregazione temporale (ad
esempio trimestralizzazione o mensilizzazione di dati annuali), mentre un
campione sezionale di ampiezza può essere estratto da un’inchiesta puntuale nel
N
tempo, ad esempio un’indagine sulla spesa di un gruppo di famiglie oppure un
censimento.
I modelli (1.1.1) e (1.1.2) sono analoghi e differiscono unicamente nel modo con
cui i dati sono stati reperiti. Naturalmente esistono modelli i cui dati sono
contemporaneamente e come nell’esempio seguente
sezionali temporali,
= α + β ; (1.1.3)
c y t = 1, 2, …, n i = 1, 2, …, N
it i i it
rappresentativo di una funzione del consumo nella quale ciascuna famiglia i
α β
possiede una propria funzione definita dai parametri e , considerati costanti
i i
nel campionario, cioè per .
periodo di osservazione t = 1, 2, …, n
Se poniamo N N N
∑ ∑ ∑
= α = α =
, ,
c c y y
t it i t it
= = =
i 1 i 1 i 1
e nell’ipotesi che tutte le propensioni marginali al consumo siano uguali,
β = β = = β = β , le equazioni (1.1.3) possono essere sommate membro a
...
1 2 N
membro in modo da dare
= α + β
c y t = 1, 2, …, n
t t
costituendo questa l’aggregazione sezionale delle (1.1.3).
Le serie storiche o temporali vengono dette in lingua inglese mentre i dati
time series
1
sezionali sono detti cross-section data. 1-2
Modulo II – Minimi quadrati
Un altro modo di aggregare le equazioni (1.1.3) è quello che si basa sulla
conoscenza della distribuzione del reddito. Se la quota di reddito posseduta dalla
y
t
λ
-esima famiglia in ogni tempo è , con il vincolo
i i
N
∑ λ = 1
i
=
i 1
si ha che = λ = =
.... ; (1.1.4)
y y t 1
, 2 ,..., n i 1
, 2 ,..., N
it i t
per cui, sostituendo le (1.1.4) nelle (1.1.3) e tenendo conto del vincolo, si ottiene
sommando membro a membro = α + β 0
c y
t t
N
∑
β = λ β
dove , di nuovo del tipo (1.1.1) ma con un’altra aggregazione sezionale.
0 i i
=1
i
Dati longitudinali
Se il campione di famiglie considerato nella (1.1.3) rimane costante negli tempi, i
n
{ } { }
dati ad esso relativi, e sono chiamati alludendo al fatto che
longitudinali,
c y
it it
un campione di più individui viene seguito lungo il tempo . Per il trattamento dei
2
dati longitudinali si usano procedure econometriche specifiche che non saranno
trattate nel presente modulo.
In lingua inglese i dati longitudinali vengono chiamati (dal termine che
panel data panel,
2
indica un gruppo di individui). 1-3
Modulo II – Minimi quadrati
1.2 Il criterio dei minimi quadrati
Generalmente i valori dei parametri di un’equazione non sono conosciuti ed occorre
a partire da un campione di osservazioni. Volendo, ad esempio,
stimarli α β
determinare i valori di e nella funzione del consumo (1.1.1), è necessario
[ ]
disporre di un campione costituito dagli consumi e dai
n c c ... c
1 2 n
[ ]
corrispondenti redditi , che possono essere temporali o sezionali a
y y ... y
1 2 n
seconda delle circostanze. In generale, nel prosieguo, supporremo che i dati siano
temporali, essendo relativamente facile utilizzare nel caso sezionale le tecniche
sviluppate partendo da osservazioni temporali.
Il campione costituito dalle e dalle può essere riportato in un grafico del
c y
t t
tipo illustrato nella figura 1.1, detto delle coppie di
diagramma di dispersione
valori , dal quale risulta evidente l’ovvia circostanza che in generale non
( c , y )
t t
esiste una retta che passi esattamente per tutti i punti individuati da questi dati, e
α β
che pertanto non esistono valori di e che soddisfino perfettamente la (1.1.1) per
ognuna delle coppie campionarie.
Il diagramma di dispersione di consumi e
reddito - Italia 1970-1996
400,000
350,000
300,000
Y90 250,000
200,000
150,000
100,000 120,000 140,000 160,000 180,000 200,000 220,000
CF90
Figura 1.1 – Il diagramma di dispersione di consumi e reddito – dati trimestrali italiani
1970:1-1996:3. Le serie utilizzate per costruire il grafico sono quelle rappresentate nella
figura I-2.2. 1-4
Modulo II – Minimi quadrati α
Si può, invece, trovare una retta del tipo (1.1.1), e quindi una coppia di valori
β,
e tale che attraversi la “nuvola” di punti nel diagramma di figura 1.1 con
( c , y )
t t
una distanza da questi punti, misurata secondo le ordinate, che obbedisca ad un
u t
particolare criterio di ottimo, scelto soggettivamente. Se il criterio fa determinare i
α̂ β̂
valori e , l’equazione della retta è = α + β
ˆ
ˆ ˆ
c y
t t α̂
definente i valori per il consumo, in funzione delle campionarie e di e
teorici ĉ y
t t
β̂ ; le differenze tra i valori e quelli per le costituiscono i
osservati teorici residui
c
t
û t = − = − α − β
ˆ
ˆ ˆ ˆ
u c c c y t = 1, 2, …, n
t t t t t { }
α̂ β̂
Ad ogni coppia , corrisponde una serie storica di residui diversa, per cui
û t
α β
finché ad e a non si danno valori determinati è possibile considerare una serie
{ }
di residui non specificata ma che si suppone generata dal modello
u t α βy (1.2.1)
u = c - - t = 1, 2, …, n
t t t α β
Si è detto che il criterio con il quale si determinano e è soggettivo; spesso si
usa il sviluppato indipendentemente dai matematici
criterio dei minimi quadrati,
K. F. Gauss e A. M. Legendre tra la fine del diciottesimo e gli inizi del
α̂ β̂
diciannovesimo secolo, mediante il quale i valori e sono calcolati
minimizzando la somma dei quadrati dei residui
2
n n
( ) ( )
∑ ∑
α β = − α − β = (1.2.2)
2
S , c y u
t t t
= =
t 1 t 1
detta dei residui .
devianza 3
Questo criterio si basa sulla ricerca della retta che attraversa la nuvola di punti
in modo tale da minimizzare la somma dei quadrati delle distanze tra se
( c , y )
t t
stessa e i punti, con tali distanze prese rispetto all’asse delle ordinate. Al posto di
questo criterio se ne possono scegliere altri, ad esempio quello basato sulla
minimizzazione della somma dei valori assoluti
n n
( ) ∑ ∑
α β = − α − β = (1.2.3)
S ' , c y u
t t t
= =
t 1 t 1 α β,
mediante il quale, ovviamente, si ricavano valori diversi, per e dai precedenti
α̂ β̂ α β.
e . Generalmente, con criteri differenti si ottengono diverse per e A
stime
α β
prescindere dal criterio utilizzato, i parametri e sono supposti valere identici
In lingua inglese: denotata con l’acronimo RSS.
Residual Sum of Squares,
3 1-5
Modulo II – Minimi quadrati
per ogni coppia e cioè per ogni . Ipotizziamo, in altre parole, che la “struttura
t
dell’economia”, nella fattispecie l’equazione del consumo, rimanga inalterata nel
ovverosia che il campione sia
periodo campionario omogeneo.
1.1- In ambedue i criteri sopra indicati i valori negativi e
Osservazione
quelli positivi delle sono trattati alla stessa stregua
u t
(simmetricamente). Nel criterio definito dalla (1.2.2) i residui
intervengono a comporre la devianza in modo non lineare, in quanto il
loro contributo ad essa è proporzionale al loro quadrato. In termini
geometrici questo equivale a dire che la retta dei minimi quadrati del
tipo (1.1.1) è determinata in modo che sia più sensibile ai punti più
“esterni” nella nuvola che non a quelli più “interni” (e vicini alla
( c , y )
t t
stessa retta). 1.2 - Le distanze sono prese parallelamente all’asse delle
Osservazione
ordinate ma potrebbero essere parimenti considerate parallelamente
all’asse delle ascisse, oppure anche ortogonali alla retta che definisce i
valori teorici .
ĉ t 1-6
Modulo II – Minimi quadrati
1.3 I minimi quadrati nel modello lineare semplice
Il modello (1.2.1) può essere scritto nella forma un poco più generale
β β (1.3.1)
u = y - - x t = 1, 2, …, n
1 2
t t t
dove è la variabile endogena (il consumo) e un’esplicativa (il reddito). In effetti
y x
t t
la non può essere considerata generalmente un’esogena poiché talvolta
x t
rappresenta un’endogena in altre equazioni; ad esempio, la che costituisce
x t
un’esogena nell’equazione singola (I-2.1.1) corrisponde all’endogena nella seconda
equazione del sistema (I-2.3.1); è più conveniente, pertanto, chiamare la nella
x t
(1.3.1) variabile (di ). In questo caso più generale i valori teorici per le
esplicativa y
t
sono dati da
y
t (1.3.2)
= β + β
ˆ ˆ
ˆ
y x t = 1, 2, …, n
t 1 2 t
mentre le differenze tra i valori osservati e quelli teorici costituiscono i valori
y ŷ t
t
dei residui = − = − β + β
ˆ ˆ (1.3.3)
ˆ ˆ
u y y y x t = 1, 2, …, n
t t t t 1 2 t
Se le variabili esplicative sono , il modello (1.3.1) viene generalizzato nell’altro
k
β β β ∀t (1.3.4)
y = x + x + … + x + u
t 1 1t 2 2t k kt t
che non necessariamente corrisponde ad una generica equazione della forma
ridotta (I-3.4.1); in linea di principio le sono variabili esplicative di per cui la
x y
it t
(1.3.4) può essere sia un’equazione qualsiasi del sistema (I-3.4.1), in forma ridotta,
sia una del sistema (I-3.2.1), in forma strutturale, risolta rispetto ad una variabile
endogena. Il modello (1.3.4) è detto La (1.3.2) è a sua volta un caso
lineare multiplo.
particolare della seguente (1.3.5)
u = g( y , x , x , …, x ; a , a , …, a ) t = 1, 2, …, n
t t 1t 2t kt 1 2 h
dove le sono le variabili esplicative, le sono i parametri del modello, variabili
x a
it j
nello spazio parametrico , e è una funzione che può essere lineare, come nella
A g
formulazione (1.3.4), oppure non lineare.
Le stime dei minimi quadrati nel modello lineare semplice
Le stime dei parametri possono essere determinate con il criterio dei minimi
a i
quadrati, per mezzo del quale si calcolano i valori per i quali si ottiene il minimo
â j
della devianza 2
n n [ ]
( ) ( )
∑ ∑
= = (1.3.6)
2
min u min g y , x , x ,..., x ; a , a ,..., a min S a , a ,..., a
t t 1
t 2 t kt 1 2 h 1 2 h
a ,..., a a ,..., a a ,..., a
= =
1 h 1 h 1 h
t 1 t 1 1-7
Modulo II – Minimi quadrati
Le condizioni necessarie affinché valga la (1.3.6) impongono che siano
soddisfatte le equazioni seguenti
∂ ∂ n
( ) ( )
∑
= =
S a , a ,..., a g y , x , x ,..., x ; a , a ,..., a 0
∂ ∂
1 2 h t 1
t 2 t kt 1 2 h
a a =
t 1
i i
per , dette Queste possono essere lineari oppure
equazioni normali.
i = 1, 2, …, h
non lineari, a seconda delle (1.3.5). Nel primo caso si perviene ai minimi quadrati
(ordinari) lineari (OLS: in lingua inglese); nel secondo
Ordinary Least Squares,
caso ai minimi quadrati non lineari (NLLS: in inglese).
Non Linear Least Squares
Nel caso lineare della (1.3.1) il criterio dei minimi quadrati (1.3.6) comporta la
determinazione del minimo seguente 2
n ( ) ( )
∑ − β − β = β β
min y x min S ,
t 1 2 t 1 2
β β β β
, ,
=
1 2 1 2
t 1 β β
per il quale occorre trovare le derivate prime di ed uguagliarle a zero,
S( , )
1 2
ottenendosi le due equazioni normali
∂
n ( )( )
S ∑
= − β − β − =
2 y x 1 0
∂
β t 1 2 t
=
t 1
1
∂ n ( )( )
S ∑
= − β − β − =
2 y x x 0
∂
β t 1 2 t t
=
t 1
2
cioè n n
∑ ∑
= β + β
y n x
t 1 2 t
(1.3.7)
= =
t 1 t 1
n n n
∑ ∑ ∑
= β + β 2
x y x x
t t 1 t 2 t
= = =
t 1 t 1 t 1
Se si pone n n n n
1 1 1 1
∑ ∑ ∑ ∑
= = = =
, , ,
2 (1.3.8)
x x y y m x m x y
t t xx t xy t t
n n n n
= = = =
t 1 t 1 t 1 t 1
dalla prima delle (1.3.7) si ricava, dividendo per ,
n
= β + β (1.3.9)
y x
1 2
β
e dalla seconda, sostituendo il valore di dato dalla (1.3.9),
1
n n n
( )
∑ ∑ ∑
= − β + β 2
x y y x x x
t t 2 t 2 t
= = =
t 1 t 1 t 1
cioè 1-8
Modulo II – Minimi quadrati
( )
= + β − 2
m y
x m x
xy 2 xx β
dalle quali si ottiene la di
stima dei minimi quadrati 2
− (1.3.10)
m y
x
β = ≠
xy
ˆ 2
m x
−
2 xx
2
m x
xx β
e, sostituendo nella (1.3.9), quella di 1 (1.3.11)
β = − β
ˆ ˆ
y x
1 2 β β
β̂ β̂
Le stime e costituiscono effettivamente un punto di minimo per in
S( , )
1 2 1 2
quanto sono soddisfatte anche le condizioni sufficienti, date dalle
2
∂ ∂ ∂ ∂ ∂
2 2 2 2 2
S S S S S
> > &
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.