Appunti Lezioni Econometria

Appunti completi delle lezioni, comprensivi di esercizi svolti in aula, domande a risposta multipla, analisi di output complete e simulazione finale della prova d'esame. Appunti basati su …

Esame Econometria finanziaria

Facoltà Scienze bancarie, finanziarie e assicurative

Dal corso del Prof. Colombo Valentina

Università Università Cattolica del "Sacro Cuore"

Publisher GA.cattolica

A.A. 2020-2021

277 pagine

3 download

Appunto

Vota 4,5 / 5 (2)

Scarica

Estratto del documento

ASSUNZIONI:

VALIDO = rispettino le condizioni di rilevanza e esogeneità.

Questo deve garantire che la media condizionata del termine di errore non dipenda dallo strumento,

in modo che valga l’indipendenza in media condizionata.

Spesso la variabile di controllo viene inserita per controllare per fattori omessi così che attraverso

l’inclusione W lo strumento Z diventi incorrelato con il termine di errore u. 238

239

Altrimenti non lo potremmo utilizzare perché violerebbe una delle proprietà.

Lezione 20 novembre 240

Uno strumento più è rilevante e più produce uno stimatore beta hat TSLS più accurato.

Se gli strumenti sono rilevanti, almeno un coefficiente phigreco collegato allo strumento sarà

diverso allo 0. Se il coeff phigreco 1 è vicino allo 0 allora lo strumento che vogliamo utilizzare al fine

di strumentare x è debole -> dirà molto poco sulla variazione di x oltre alle variabili esogene. La

prima cosa da fare nel primo stadio per vedere se lo strumento è rilevante o meno è andare a vedere

i coefficienti.

Se il coefficiente è debole avremo degli intervalli di confidenza al 95% ad esempio avremo (beta

TLSL + o – il valor critico per lo standard error) possono contenere il vero valore del coefficiente in

molto meno del 95% dei casi perché c’è un problema di distorsione quindi se lo strumento è debole

il TSLS non è molto affidabile, per cui dovremmo considerare il caso semplice di una variabile

endogena, uno strumento, che se è valido avremo che il beta stimato con TSLS è consistente perché

la varianza campionaria, quindi la cov di y e z e la cov di x e z saranno consistenti. Avremo che nel

caso in cui lo stimatore sia valido e non debole avremo che: 241

Questo è il problema che vogliamo risolvere

è Ma attraverso x

Se lo strumento non è rilevante la correlazione tra x e u non sarà pari a 0, per cui lo strumento sarà

debole -> quindi abbiamo il problema che beta stimato attraverso TSLS non. Convergerà verso il

vero valore della popolazione.

Se z è irrilevante la varianza Szx sarà pari a 0 e se debole sarà vicino allo 0 per cui ci sarà il problema

di convergenza. Tra cui appunto gli intervalli di confidenza

Strumenti deboli significa che la correlazione tra x e il termine di errore è prossima allo 0. In questo

caso la distribuzione di uno stimatore TSLS è una non normale (linea scusa tratteggiata) centrata

attorno al valore dell’OLS in grandi campioni ma alle code si distribuisce in modo strano.

Come facciamo a capire in una regressione se uno strumento è rilevante o meno? 242

Un modo per controllare la rilevanza dello strumento è quello di calcolare l’F-test del primo stadio.

Nel momento in cui regrediamo la variabile endogena sugli strumenti e variabili esogene, andiamo

poi a regredire y sui valori stimati di x oltre che alle covariate. Come capiamo che lo strumento è

rilevante? Quando andiamo a regredire x su Z e W andiamo a vedere la stat f del primo stadio ->

questa ci fornisce una misura del contenuto informativo presente negli strumenti. Maggiore è il

contenuto e più aumenterà il valore di f.

Se siamo di fronte ad uno strumento forte, l’f test deve essere maggiore di 10 -> significa che la

distorsione del beta TSLS è inferiore al 10% rispetto al beta calcolato con OLS. Se f test è inferiore a

10 la distorsione del beta calcolato con il TSLS rispetto all’OLS è superiore al 10%. 243

Che cosa fare se si hanno strumenti deboli

• Procurarsi strumenti migliori (più facile a dirsi che a farsi!)

• Se si hanno molti strumenti, alcuni sono probabilmente più deboli di altri ed è una buona idea

scartare i più deboli (scartando uno strumento irrilevante si aumenta la statistica F del primo stadio)

• Se si hanno pochi strumenti, e sono tutti deboli, allora occorre eseguire un’analisi IV al di là del

TSLS...

• Separare il problema della stima di β1 e della costruzione di intervalli di confidenza

Un esempio è quello del metodo di Anderson – Rubin. Regressione di Y* su strumenti e variabili W

Perfetto per l’omoschedasticità, ma per la eteroschedasticità? 244

245

Abbiamo una regressione y in

cui c’è la costante, variabili x

di cui una supponiamo essere

endogena e una serie di W

esogene che servono per

spiegare la variazione di y, più

il termine di errore u.

Rispetto al termine di errore u stimato

J=numero di strumenti*il valore di F.

Con j=0 -> Che senso ha fare un test di sovraidentificazione se abbiamo solo uno strumento per la

variabile endogena? Se alcuni strumenti sono endogeni e altri esogeni J sarà grande, la nulla che

tutti gli strumenti siano esogeni sarà respinta. 246

247

248

Per calcolare la variazione a 10 anni è come se

includessimo le dummy, ovvero i-1 dummy, per cui 47. Se

invece inserissimo le dummy per individuare gli anni 249

saranno 9.

Se chiede di descrivere l’elasticità della domanda rispetto al prezzo ci sta chiedendo l’effetto

marginale, quindi come varia la quantità domandata in percentuale rispetto alla variazione dell’1%

del prezzo.

Il coefficiente che cattura tale elasticità è beta 1. Mentre il coeff per l’elasticità della

è domanda rispetto al reddito sarà beta 2. Tax come differenza tra 1995 e 1985

Abbiamo una TSLS dove il coefficiente prezzo (il primo) è statisticamente significativo? Si, il reddito

(Secondo)? No. Il coefficiente del prezzo indica che (dati log-log quindi lo interpretiamo come

elasticità) all’aumentare dell’1% del prezzo delle sigarette la domanda diminuisce dello 0,938%.

250

251

Il valore dell’f-test è maggiore di 10

per cui gli strumenti non sono deboli,

c’è stato un netto miglioramento

rispetto alla tabella precedente dell’f-

test.

4,93=m*F (con F del secondo stadio) (dalle info che abbiamo ora non è possibile calcolarlo) 252

Siamo partiti dalla considerazione che laddove la correlazione tra x e u fosse diverso da 0, allora in

questo caso si andava a violare una delle assunzioni fondamentali dell’OLS e quindi lo stimatore

OLS non fosse più stato efficiente. A volte noi siamo sicuri che ci sia questo problema di 253

correlazione tra la variabile x e il termine di errore, altre volte non sappiamo. Come facciamo a

testare se effettivamente siamo in presenza di endogeneità di x o meno? Andremo a considerare 2

varianti dell’Hausman test, entrambe servono a verificare se siamo in presenza di endogeneità o

meno. Questo perché se siamo in presenza di endogeneità dovremmo utilizzare gli instrumental

variables, altrimenti potremmo utilizzare gli OLS. 254

Il primo stage di questo test è di regredire X che secondo noi è endogena, sulle covariate:

2, 255

Una volta fatto ciò bisognerà andare a riprendere la regressione base e si andrà ad aggiungere a

questa la parte endogena di x2, quindi, ad esempio, beta3.

Se noi guardiamo al coefficiente beta3, è come se avessimo un t-ratio. Se invece avessimo più di

uno strumento avremmo un f-test (come segue) 256

L’idea è quella di stimare e comparare il beta OLS e quello TSLS e decidere quella più appropriata.

Quindi stimare il modello attraverso IV e OLS e confrontare per capire quale deve essere utilizzata.

È importante tenere a mente questa tabella OLS TSLS (IV)

Corr(x,u)=0 Lo stimatore è: Strumenti di stima:

- Consistente - Consistente

- Efficiente - Ma inefficiente

Corr(x,u)≠0 Lo stimatore è: Strumento di stima:

- inconsistente - consistente 257

Il concetto fondamentale è che comunque si testa l’esogeneità della variabile. 258

In questo output è stato prima calcolato il coefficiente relativo all’instrumental variable, per poi

calcolare quello dell’OLS e farne la differenza per singolo coefficiente, si inverte la differenza per lo

standard error. Viene fatto il test per singola variabile, ma tenendo in considerazione anche le altre

variabili incluse nella specificazione -> non dobbiamo rigettare la nulla di le variabili esogene, ma

tiene conto della matrice di tutte le variabili incluse nel primo e nel secondo step per TSLS o uno per

OLS. 259

Esercizi

Comprensione delle tabelle:

Determinazione del salario basato su una survey per giovani del 1979 e include dati relativi a maschi

e femmine dell’età tra i 14 e i 21 anni. Questa survey è stata condotta dal 1979 al 1994, dal 94 poi

ogni 2 anni. Originariamente i dati comprendevano 3003 maschi e 3108 femmine.

L’idea è quella di capire il guadagno orario considerando diverse informazioni, come istruzione S,

female se donna (dummy variable) wexp (esperienza lavorativa misurata in anni), ethblack (etnia

nera, dummy variable), ethisp (etnia ispanica, altra dummy variable) e infine la costante.

L’obiettivo è vedere come le variabili impattano il guadagno orario. La cosa da osservare nella

specificazione è che viene utilizzato il log del guadagno su una costante su una serie di costanti tra

cui dummy, quindi log-lin model -> dovremmo trasformare le dummy con l’antidummy -> (antilog-

1)*100 (forme strutturali). 260

Ciò che andiamo a considerare adesso:

abbiamo i dati, andiamo a fare la regressione semplice

problema: stimiamo attraverso OLS o IV? Per rispondere alla domanda dovremmo innanzitutto

stimare il modello -> quindi stimiamo il modello utilizzando l’OLS e otterremo l’OUTPUT. Questi

indicheranno log a sinistra, quindi variabili qualitative che sono istruzione, esperienza, dummy

variables… quali sono i coeff statisticamente significativi?

- Istruzione -> all’aumentare degli anni scolastici la funzione di guadagno dell’individuo

aumenta del 12%.

- Wexp -> un anno in più di esperienza determina un guadagno pari al 3,2%.

- Female

- Ethbalck -> come la dummy va ad impattare sul guadagno -> dobbiamo utilizzare l’antilog

per cui utilizzeremo questa operazione:

Quindi in questo caso è pari a -18,6% -> significa che il fatto di essere nero determina un

guadagno rispetto ad essere bianco del 18,6% in meno

Log-Lin:

Variabili qualitative -> es. dummy -> valutate con l’antilog

o Variabili quantitative

- Ethisp -> avrebbe un impatto, dopo aver applicato l’antilog, del -9,4% -> il far parte dell’etnia

ispanica permette di guadagnare il 9,4% in meno -> attenzione che questo coeff non è

statisticamente significativo per cui il valore del coefficiente sarà pari a 0.

Anteprima

Vedrai una selezione di 10 pagine su 277