ASSUNZIONI:
VALIDO = rispettino le condizioni di rilevanza e esogeneità.
Questo deve garantire che la media condizionata del termine di errore non dipenda dallo strumento,
in modo che valga l’indipendenza in media condizionata.
Spesso la variabile di controllo viene inserita per controllare per fattori omessi così che attraverso
l’inclusione W lo strumento Z diventi incorrelato con il termine di errore u. 238
239
Altrimenti non lo potremmo utilizzare perché violerebbe una delle proprietà.
Lezione 20 novembre 240
Uno strumento più è rilevante e più produce uno stimatore beta hat TSLS più accurato.
Se gli strumenti sono rilevanti, almeno un coefficiente phigreco collegato allo strumento sarà
diverso allo 0. Se il coeff phigreco 1 è vicino allo 0 allora lo strumento che vogliamo utilizzare al fine
di strumentare x è debole -> dirà molto poco sulla variazione di x oltre alle variabili esogene. La
1
prima cosa da fare nel primo stadio per vedere se lo strumento è rilevante o meno è andare a vedere
i coefficienti.
Se il coefficiente è debole avremo degli intervalli di confidenza al 95% ad esempio avremo (beta
TLSL + o – il valor critico per lo standard error) possono contenere il vero valore del coefficiente in
molto meno del 95% dei casi perché c’è un problema di distorsione quindi se lo strumento è debole
il TSLS non è molto affidabile, per cui dovremmo considerare il caso semplice di una variabile
endogena, uno strumento, che se è valido avremo che il beta stimato con TSLS è consistente perché
la varianza campionaria, quindi la cov di y e z e la cov di x e z saranno consistenti. Avremo che nel
caso in cui lo stimatore sia valido e non debole avremo che: 241
y
Questo è il problema che vogliamo risolvere
è Ma attraverso x
Se lo strumento non è rilevante la correlazione tra x e u non sarà pari a 0, per cui lo strumento sarà
debole -> quindi abbiamo il problema che beta stimato attraverso TSLS non. Convergerà verso il
vero valore della popolazione.
Se z è irrilevante la varianza Szx sarà pari a 0 e se debole sarà vicino allo 0 per cui ci sarà il problema
di convergenza. Tra cui appunto gli intervalli di confidenza
è
è
Strumenti deboli significa che la correlazione tra x e il termine di errore è prossima allo 0. In questo
caso la distribuzione di uno stimatore TSLS è una non normale (linea scusa tratteggiata) centrata
attorno al valore dell’OLS in grandi campioni ma alle code si distribuisce in modo strano.
Come facciamo a capire in una regressione se uno strumento è rilevante o meno? 242
Un modo per controllare la rilevanza dello strumento è quello di calcolare l’F-test del primo stadio.
Nel momento in cui regrediamo la variabile endogena sugli strumenti e variabili esogene, andiamo
poi a regredire y sui valori stimati di x oltre che alle covariate. Come capiamo che lo strumento è
rilevante? Quando andiamo a regredire x su Z e W andiamo a vedere la stat f del primo stadio ->
questa ci fornisce una misura del contenuto informativo presente negli strumenti. Maggiore è il
contenuto e più aumenterà il valore di f.
Se siamo di fronte ad uno strumento forte, l’f test deve essere maggiore di 10 -> significa che la
distorsione del beta TSLS è inferiore al 10% rispetto al beta calcolato con OLS. Se f test è inferiore a
10 la distorsione del beta calcolato con il TSLS rispetto all’OLS è superiore al 10%. 243
Che cosa fare se si hanno strumenti deboli
• Procurarsi strumenti migliori (più facile a dirsi che a farsi!)
• Se si hanno molti strumenti, alcuni sono probabilmente più deboli di altri ed è una buona idea
scartare i più deboli (scartando uno strumento irrilevante si aumenta la statistica F del primo stadio)
• Se si hanno pochi strumenti, e sono tutti deboli, allora occorre eseguire un’analisi IV al di là del
TSLS...
• Separare il problema della stima di β1 e della costruzione di intervalli di confidenza
Un esempio è quello del metodo di Anderson – Rubin. Regressione di Y* su strumenti e variabili W
Perfetto per l’omoschedasticità, ma per la eteroschedasticità? 244
245
Abbiamo una regressione y in
cui c’è la costante, variabili x
di cui una supponiamo essere
endogena e una serie di W
esogene che servono per
spiegare la variazione di y, più
il termine di errore u.
Rispetto al termine di errore u stimato
J=numero di strumenti*il valore di F.
Con j=0 -> Che senso ha fare un test di sovraidentificazione se abbiamo solo uno strumento per la
variabile endogena? Se alcuni strumenti sono endogeni e altri esogeni J sarà grande, la nulla che
tutti gli strumenti siano esogeni sarà respinta. 246
247
248
Per calcolare la variazione a 10 anni è come se
includessimo le dummy, ovvero i-1 dummy, per cui 47. Se
invece inserissimo le dummy per individuare gli anni 249
saranno 9.
Se chiede di descrivere l’elasticità della domanda rispetto al prezzo ci sta chiedendo l’effetto
marginale, quindi come varia la quantità domandata in percentuale rispetto alla variazione dell’1%
del prezzo.
Il coefficiente che cattura tale elasticità è beta 1. Mentre il coeff per l’elasticità della
è domanda rispetto al reddito sarà beta 2. Tax come differenza tra 1995 e 1985
Abbiamo una TSLS dove il coefficiente prezzo (il primo) è statisticamente significativo? Si, il reddito
(Secondo)? No. Il coefficiente del prezzo indica che (dati log-log quindi lo interpretiamo come
elasticità) all’aumentare dell’1% del prezzo delle sigarette la domanda diminuisce dello 0,938%.
250
251
Il valore dell’f-test è maggiore di 10
per cui gli strumenti non sono deboli,
c’è stato un netto miglioramento
rispetto alla tabella precedente dell’f-
test.
4,93=m*F (con F del secondo stadio) (dalle info che abbiamo ora non è possibile calcolarlo) 252
Siamo partiti dalla considerazione che laddove la correlazione tra x e u fosse diverso da 0, allora in
questo caso si andava a violare una delle assunzioni fondamentali dell’OLS e quindi lo stimatore
OLS non fosse più stato efficiente. A volte noi siamo sicuri che ci sia questo problema di 253
correlazione tra la variabile x e il termine di errore, altre volte non sappiamo. Come facciamo a
testare se effettivamente siamo in presenza di endogeneità di x o meno? Andremo a considerare 2
varianti dell’Hausman test, entrambe servono a verificare se siamo in presenza di endogeneità o
meno. Questo perché se siamo in presenza di endogeneità dovremmo utilizzare gli instrumental
variables, altrimenti potremmo utilizzare gli OLS. 254
Il primo stage di questo test è di regredire X che secondo noi è endogena, sulle covariate:
2, 255
Una volta fatto ciò bisognerà andare a riprendere la regressione base e si andrà ad aggiungere a
questa la parte endogena di x2, quindi, ad esempio, beta3.
Se noi guardiamo al coefficiente beta3, è come se avessimo un t-ratio. Se invece avessimo più di
uno strumento avremmo un f-test (come segue) 256
L’idea è quella di stimare e comparare il beta OLS e quello TSLS e decidere quella più appropriata.
Quindi stimare il modello attraverso IV e OLS e confrontare per capire quale deve essere utilizzata.
È importante tenere a mente questa tabella OLS TSLS (IV)
Corr(x,u)=0 Lo stimatore è: Strumenti di stima:
- Consistente - Consistente
- Efficiente - Ma inefficiente
Corr(x,u)≠0 Lo stimatore è: Strumento di stima:
- inconsistente - consistente 257
Il concetto fondamentale è che comunque si testa l’esogeneità della variabile. 258
In questo output è stato prima calcolato il coefficiente relativo all’instrumental variable, per poi
calcolare quello dell’OLS e farne la differenza per singolo coefficiente, si inverte la differenza per lo
standard error. Viene fatto il test per singola variabile, ma tenendo in considerazione anche le altre
variabili incluse nella specificazione -> non dobbiamo rigettare la nulla di le variabili esogene, ma
tiene conto della matrice di tutte le variabili incluse nel primo e nel secondo step per TSLS o uno per
OLS. 259
Esercizi
Comprensione delle tabelle:
Determinazione del salario basato su una survey per giovani del 1979 e include dati relativi a maschi
e femmine dell’età tra i 14 e i 21 anni. Questa survey è stata condotta dal 1979 al 1994, dal 94 poi
ogni 2 anni. Originariamente i dati comprendevano 3003 maschi e 3108 femmine.
L’idea è quella di capire il guadagno orario considerando diverse informazioni, come istruzione S,
female se donna (dummy variable) wexp (esperienza lavorativa misurata in anni), ethblack (etnia
nera, dummy variable), ethisp (etnia ispanica, altra dummy variable) e infine la costante.
L’obiettivo è vedere come le variabili impattano il guadagno orario. La cosa da osservare nella
specificazione è che viene utilizzato il log del guadagno su una costante su una serie di costanti tra
cui dummy, quindi log-lin model -> dovremmo trasformare le dummy con l’antidummy -> (antilog-
1)*100 (forme strutturali). 260
Ciò che andiamo a considerare adesso:
abbiamo i dati, andiamo a fare la regressione semplice
problema: stimiamo attraverso OLS o IV? Per rispondere alla domanda dovremmo innanzitutto
stimare il modello -> quindi stimiamo il modello utilizzando l’OLS e otterremo l’OUTPUT. Questi
indicheranno log a sinistra, quindi variabili qualitative che sono istruzione, esperienza, dummy
variables… quali sono i coeff statisticamente significativi?
- Istruzione -> all’aumentare degli anni scolastici la funzione di guadagno dell’individuo
aumenta del 12%.
- Wexp -> un anno in più di esperienza determina un guadagno pari al 3,2%.
- Female
- Ethbalck -> come la dummy va ad impattare sul guadagno -> dobbiamo utilizzare l’antilog
per cui utilizzeremo questa operazione:
Quindi in questo caso è pari a -18,6% -> significa che il fatto di essere nero determina un
guadagno rispetto ad essere bianco del 18,6% in meno
Log-Lin:
Variabili qualitative -> es. dummy -> valutate con l’antilog
o Variabili quantitative
o
- Ethisp -> avrebbe un impatto, dopo aver applicato l’antilog, del -9,4% -> il far parte dell’etnia
ispanica permette di guadagnare il 9,4% in meno -> attenzione che questo coeff non è
statisticamente significativo per cui il valore del coefficiente sarà pari a 0.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
-
Appunti Econometria
-
Appunti Econometria
-
Appunti Econometria
-
Appunti di Modelli econometrici - econometria (CLAMM)
- Risolvere un problema di matematica
- Riassumere un testo
- Tradurre una frase
- E molto altro ancora...
Per termini, condizioni e privacy, visita la relativa pagina.