11/9/2020
ECONOMETRIA
Cos’è l’econometria?
L’econometria è:
la scienza che sottopone a verifica le teorie economiche;
• l’insieme di strumenti usati per prevedere i valori futuri delle variabili economiche;
• un processo con cui si adattano i modelli economici matematici ai dati del mondo reale;
• l’arte e la scienza di usare dati storici per fare raccomandazione di politica economica.
•
L’econometria si occupa dello L’econometria utilizza quindi
studio quantitativo delle relazioni economiche.
tecniche statistiche per interpretare la realtà alla luce della teoria economica.
L’econometria può essere utilizzata in diversi campi: finanza, economia del lavoro, macroeconomia,
microeconomia, marketing, politica economica, scienze politiche, sociologia, ecc.
A cosa serve l’econometria?
L’econometria serve “a dare una risposta quantitativa ad una domanda economica”. Per esempio:
Quale frazione del reddito disponibile viene consumata?
• Qual è l’effetto dell’aumento dei prezzi sulla quantità domandata?
• Come variano i salari quando aumenta la produttività?
• Qual è l’effetto sulla spesa sanitaria di una riduzione del tasso di inquinamento? Perché
• l’inquinamento crea malattie e quindi lo Stato se ne interessa dato che il sistema sanitario italiano è
gratuito.
Qual è l’effetto di un aumento della spesa R&S sul numero di brevetti registrati?
• Di quanto cambia la probabilità di perdere il posto di lavoro in base al livello di educazione?
• Quali effetti hanno gli attentati terroristici sul tasso di crescita di un’economia?
• Di quanto si riducono le esportazioni se il tasso si apprezza? Se il tasso all’esportazione si apprezza,
• si ridurranno le esportazioni e si ridurrà il PIL.
Quanto si caricano i dati per effettuare una regressione bisogna fare attenzione alla natura dei dati che si
stanno impiegando perché le conclusioni sono diverse. L’esempio reddito-consumo (slide 16) mostra due
diversi grafici in base all’utilizzo di dati nominali o reali.
Elementi di uno studio econometrico:
modello economico e ipotesi di fondo
• modello econometrico
• dati
• stime
• interpretazione dei risultati
•
Elementi di studio econometrico: Modello Econometrico
Il permette di valutare qual è l’effetto di determinate variabili sulla
modello di regressione multivariato
variabile di interesse, mantenendo tutte le altre condizioni/caratteristiche costanti, ciò corrisponde al ceteris
in microeconomia. Il tentativo è quello di passare da correlazioni ad effetti causali (ad un’azione
paribus
specifica corrispondente una specifica e misurabile conseguenza. Es. fertilizzanti-pomodori, sussidi-
disoccupazione?)
Elementi di uno studio econometrico: Dati
I dati economici sono in generale dati non sperimentali.
Si distinguono in: 1
(cross-section): n > 1 unità, T = 1 (osservate in un solo periodo). Per cui, stiamo
§ dati selezionali
sfruttando le differenze tra le unità (persone, imprese, regioni, scuole, ecc...) consentono lo studio
delle relazioni tra variabili e (talvolta) degli effetti causali
(time series): n = 1, T > 1 periodi. Per cui, stiamo seguendo nel tempo una unità
§ Serie temporali
(persona, impresa, regione, scuola, ecc...), consentono lo studio dell'evoluzione di un fenomeno nel
tempo, anche al fine di prevederne l'andamento futuro;
(o dati longitudinali): n > 1 unità, T > 1 periodi. Per cui stiamo seguendo nel tempo lo
§ dati di Panel
stesso gruppo di entità, consentono lo studio delle relazioni tra variabili e la loro eventuale
evoluzione temporale.
Attenzione… nelle Stime
Vi è incertezza più o meno ampia intorno ai valori ottenuti. Le risposte (sebbene di tipo quantitativo)
dipendono dai dati e contengono incertezza: occorre fornire sia una risposta numerica, sia una misura della
precisione.
Capitolo 3 Una breve panoramica del modello classico di regressione lineare
La regressione è probabilmente lo strumento più importante che un econometrico ha a disposizione.
L’analisi descrive e valuta la relazione tra una data variabile, chiamata variabile dipendente,
delle regressioni
e una o più variabili, chiamate variabili indipendenti. Se la regressione descrive la relazione tra due variabili,
una dipendente e una indipendente, si parla di se invece la regressione
regressione lineare bivariata,
descrive la relazione tra una variabile dipendente e più variabili indipendenti, allora si parla di regressione
L’idea essenziale alla base dell’analisi delle regressioni è che una o più variabili sono in relazione
multivariata.
tra di loro in un particolar modo, ossia una o più variabili determinano un impatto su una data variabile (es.:
come la variazione del reddito x può influire sul consumo y). La variabile spiegata, che si muove a seguito
dell’altra variabile, è chiamata La è, invece, quella che spiega
variabile dipendente. variabile indipendente
la variabile dipendente.
Alcune notazioni
La variabile dipendente y dipende da una serie di altre variabili indipendenti x, che chiameremo x , x , …, x ,
1 2 k
dove k indica il numero delle variabili indipendenti. Ad esempio, il consumo (y) dipende dal reddito
disponibile (x ), dal prezzo (x ) e da una serie di altre variabili dipendenti fino a x , ovvero: y = x + x + … + x .
1 2 k 1 2 k
Per semplicità assumeremo inizialmente che k = 1, quindi ci focalizzeremo su un modello lineare semplice
dove abbiamo una sola variabile indipendente capace di spiegare la variabile dipendente.
Le variabili y e x possono essere chiamate con diversi nomi:
y = dependent variable, regressand, effect variable, explained variable;
• x = independent variables, regressors, causal variables, explanatory variable.
•
La regressione è diversa dalla correlazione
Si può pensare che un sinonimo della regressione sia la Tuttavia, se diciamo che x e y sono
correlazione.
correlate, significa che x è correlata a y e che y è correlata a x, ovvero che stiamo trattando y e x in modo
completamente simmetrico.
Tuttavia, nella regressione trattiamo la variabile dipendente (y) e la variabile indipendente (x) in modo molto
diverso. Si assume che la variabile y sia casuale (random), cioè che abbia distribuzione di probabilità, e che,
invece, le variabili x siano valori fissi in campioni ripetuti. 2
Regressione semplice
Per semplicità assumiamo che k = 1. Questa è la situazione in cui y dipende da una sola variabile x, ovvero è
il caso della regressione lineare bivariata. La regressione lineare bivariata, nonostante risulta più semplice
della regressione multivariata, permette, ad esempio, di:
studiare come i rendimenti degli asset possano variare al variare del market risk;
• misurare la relazione di lungo termine tra stock prices e dividendi;
• costruire un rapporto di copertura ottimale.
•
Esempio:
Supponiamo di avere i seguenti dati relativi al rendimento in eccesso di un fondo XXX e di avere accesso a
dei dati relativi al rendimento in eccesso di un market index:
Abbiamo l’idea che il fondo XXX ha investito negli stessi asset che possiamo trovare nel market index ma con
un peso diverso. Se volessimo stimare la relazione tra gli del fondo e gli del
excess return excess return market
questa relazione sarebbe positiva perché il fondo è investito su degli asset che sono contenuti nel
index,
market index. In termini di CAPM ci aspettiamo che il beta di questo fondo sia positivo.
Graph (Scatter Diagram)
I 5 punti rappresentati nel grafico sono le osservazioni. La prima mossa effettuata è stata quella di plottare i
dati nello scatter plot e guardare le caratteristiche di questi dati. Sono stati plottati sull’asse delle ascisse gli
sul e sull’asse delle ordinate gli sul fondo XXX. Si può notare
excess return market portfolio excess return
l’esistenza di una tra il fondo XXX e quello relativo al market index. Successivamente si può
relazione positiva
tracciare una linea retta che possa catturare approssimativamente questa relazione positiva espressa dai
punti; è ovvio che non si riuscirà ad interpolare tutti i dati sulla linea retta. Tracciando la linea retta si sta
sopravvalutando il valore di y rispetto al data point (per i punti sotto la retta) e si sta sottovalutando il valore
di y rispetto al data point (per punti sopra la retta).
Trovare una linea di Best Fit
L’equazione generica in grado di descrivere la relazione lineare tra le variabili è la seguente:
y = a + bx,
dove: a rappresenta il valore di y quando x = 0, quindi l’intercetta;
• b rappresenta il coefficiente angolare, cioè la pendenza.
• 3
Tuttavia, questa equazione è completamente deterministica, ovvero per un dato valore di x, y assume un
determinato valore. Il valore di y non si può però predire con esattezza. Questo perché, innanzitutto, questa
relazione potrebbe non essere perfettamente lineare e, inoltre, tutti i data point non giacciono esattamente
sulla linea retta. Pertanto, è necessario aggiungere alla precedente equazione un (random
termine di errore
! "x
L’equazione diventa:
disturbance), u. + + ,
y = u
t t
t
!
dove: " = intercetta;
• = pendenza;
• u = margine di errore;
• t
t= 1,2,3,4,5.
•
Perché abbiamo inserito il termine di errore?
Il termine di errore può catturare una serie di caratteristiche:
spesso tralasciamo alcune determinanti di y , cioè alcune variabili fondamentali per capire l’impatto
• t
su y;
nella misurazione di y potrebbero esserci degli errori non modellabili;
• t
la misurazione di y potrebbe essere influenzata da elementi casuali esterni non modellabili.
• t
Come determiniamo i coefficienti della regressione? ! ".
e Tali
Per tracciare la linea retta all’interno dello scatter plot è necessario determinare i coefficienti
coefficienti devono essere determinati in modo da permettere alla linea retta di minimizzare l’errore di
previsione u , che rappresenta la distanza verticale tra il data point e il punto della retta corrispondente. Per
t
cui, ci interessa minimizzare questa distanza verticale. Bisogna considerare la distanza verticale e non quella
orizzontale perché il nostro obiettivo è quello di predire il valore di y tenendo fisso il valore di x.
Ordinary Least Squares (OLS)
Inoltre, vogliamo trovare la linea che minimizza la somma di queste distanze e per farlo è possibile utilizzare
vari metodi. Alcuni punti sono al di sopra di questa linea retta, per cui vi è una distanza positiva; altri punti
però si trovano al di sotto della linea retta, per cui vi è una distanza negativa. Se minimizziamo la somma tra
la distanza verticale positiva e quella negativa, è possibile che le due distanze si eliminino a vicenda.
Il metodo migliore per minimizzare questi errori è quello di utilizzare la somma dei quadrati dei residui,
perché il quadrato dà maggior peso agli scarti più grandi, che sono quelli che disturbano maggiormente i
! ".
risultati. Sommando le aree dei quadrati ottenuti dalla distanza tra il data point e la retta, è possibile trovare
e Tale metodo, noto
la retta di regressione che permette di stimare al meglio il valore dei coefficienti ! ",
come (OLS, metodo dei minimi quadrati), è usato per fare in modo che la linea di
Ordinary Least Squares
regressione riesca a “fittare” i dati nel modo migliore possibile e ci consente di trovare il valore di e cioè
dell’intercetta e del coefficiente angolare. Il metodo dei minimi quadrati permette quindi di minimizzare la
somma dei quadrati dei residui. 4
Si osservi la seguente notazione:
#
$ denota il data point, cioè il dato reale.
y
t
%
& '
$
denota il valore “fittato” (fitted che si ottiene dalla regressione.
value)
! .
denota il termine di errore (o termine residuo) ed è dato dalla differenza: y -
t
! "
(quando un valore deriva da una regressione si mette il cappellino)
Valore attuale e fittato $
u)
Il punto rappresentato nel grafico sulla linea retta è il valore di y fittato (' ); il punto blu in alto è un data
"
, che indica il margine di errore.
point, cioè un dato reale; la differenza tra i due punti è
Il nostro obiettivo è quello di trovare la retta che permetta di fittare nel miglior modo possibile i dati al fine
di minimizzare la somma dei quadrati dei residui.
Come funziona l’OLS
Il metodo dei minimi quadrati (OLS) consente di minimizzare la somma dei quadrati dei residui al fine di dare
più peso agli scarti più grandi: - - - - - -
= ,
* , + , + , + , + ,
$ # # # # #
#
" & # ' ( $
"%& , = ' − '
& $
" " " -
∑(' ) ∑
− ' ,
$ #
#
Pertanto, minimizzare rispetto ad alfa e beta.
è equivalente a minimizzare
" " "
Come minimizzare questo errore di previsione mediante l’OLS?
Innanzitutto, si vuole minimizzare la somma dei quadrati dei residui andando a considerare (Loss
L Function),
che è una funzione che va a misurare la perdita. "45
' = !) +
$
Poiché: " " "45
)
allora: 6 = *(' − ' *7' − !) − 8
=
$ #
#
" " " "
" )
"4
!)
Al fine di minimizzare la somma dei quadrati dei residui, cioè è necessario determinare le derivate rispetto
L,
(pendenza):
ad (intercetta) e 5
!),
Dalla (1), che minimizza rispetto ad si ha che (1b):
L 9
# #
Dove T è il numero di osservazioni, che nel nostro caso è pari a 5.
'
Il (o atteso) (variabile dipendente), cioè , è uguale a 1 fratto il numero di osservazioni
valore medio di ! 1
, ovvero:
(T) per la sommatoria di ': = * '
" < " 9
= =
5
e il (o valore atteso) (variabile indipendente), cioè , è uguale a 1 fratto il numero di
valore medio di ! 1
, ovvero:
osservazioni (T) per la sommatoria di 5̅ = * 5
" < "
Moltiplicando il tutto per T si ha che (1c):
e <"45̅
<': − <!) − = 0
Sostituendo (1c) nella (1b) si ottiene (3): "45̅
': − !) − = 0
Dividendo per T si ottiene (3a):
L’espressione (3a) contiene tutti parametri che si ottengono da una regressione e che quindi devono essere
stimati. "4 , si ha che (4):
Dalla (2), che minimizza rispetto a
L
Dalla (3) si deriva (5):
!) (ovvero la (5)) nella (4) si ottiene:
Sostituendo 6
"4 a sinistra e portando a destra gli altri termini si ottiene:
Isolando "4
Quindi è possibile ricavare :
Questo metodo, che permette di minimizzare la somma dei quadrati dei residui, e quindi di trovare l’ottimo,
B
@
$ A
è conosciuto come (OLS)
Ordinary Least Squares Metodo dei Minimi Quadrati.
o
e ?
Per cosa usiamo "4 "4
!) = −1,74 = 1,64. !)
Nell’esempio del CAPM visto precedentemente abbiamo 5 osservazioni e utilizzando le formule appena
e Sostituendo i valori di e
determinate si ottiene la stima di si ottiene la linea
"45
' = !) + = −1,74 + 1,645
$
fittata: " " "
Se un analista ti dice che si aspetta che il prossimo anno il mercato produca un rendimento del 20% (= market
index) in più rispetto al risk-free rate, quanto ti aspetteresti che sarà il ritorno del fondo XXX?
' = −1,74 + 1,645 = −1,74 + 1,64 ∗ 20% = 31,06%
$
Sostituendo il market index pari al 20% nella retta fittata y ci aspettiamo che il fondo XXX renderà:
t
" "
Per cui ci aspettiamo che il fondo XXX renderà il 31,06%, ovvero l’11,06% in più rispetto al market index.
!) ')
è il valore dell’intercetta, quindi è il valore di quando il valore di x è pari a 0. Se non ci sono nei dati valori
di x pari a 0, di conseguenza non avremmo nessuna osservazione vicino all’asse delle y:
La Popolazione e il Campione
La è la collezione totale di tutti gli oggetti o persone che saranno studiati. Per esempio, tutto
popolazione
l’elettorato rappresenta una popolazione che deve essere studiata, per cui se si vuole fare una previsione del
risultato elettorale negli USA bisogna prendere una parte dell’elettorato per studiare l’intenzione di voto. In
econometria difficilmente si lavora con l’intera popolazione ma si lavora per campioni.
Un è una selezione di una parte della popolazione che deve essere rappresentativo della
campione
popolazione e deve coprire tutte le caratteristiche che presenta la stessa popolazione di interesse. Quindi il
campione dovrà includere differenti strati della popolazione in modo da ridurre al minimo l’errore che
potrebbe derivare dalla previsione.
Bisogna distinguere tra la funzione di regressione della popolazione (PRF, e
Population Regression Function)
la funzione di regressione del campione (SRF, Sample Regression Function). 7
! ").
La (PRF) è una descrizione del modello che si pensa che generi i
funzione di regressione della popolazione e
dati veri e la relazione reale tra le variabili (cioè i valori reali di
' = ! + "5 + ,
La è:
PRF " " "
"45
' = !) + , = ' − '
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.