Estratto del documento

Dipartimento di Scienze EconomicheUniversità di Verona

Elementi di EconometriaEsercizi #4

(Stock-Watson) Considerate il modello di regressione yi = β0 + β1xi + β2Wi + ui dove Cov(xi, ui) ≠ 0. Per ciascuno dei seguenti casi indicate se Zi è una variabile strumentale valida:

  • Zi è indipendente da (yi, xi, Wi).
  • Zi = Wi.
  • Zi = xi.

(Stock-Watson) In un modello di regressione con variabili strumentali con un singolo regressore, Xi e due strumenti, Zi1 e Zi2, il valore della statistica J è pari a J = 18.2.

  • Questo suggerisce che Zi1 e Zi2 siano esogeni? Motivate la risposta.
  • Questo suggerisce che Zi1 sia esogeno? Motivate la risposta.

(Stock-Watson) Considerate il modello di regressione Yi = β0 + β1Xi + β2Wi + ui dove Cov(Xi, ui) ≠ 0 e Zi è uno strumento valido. Supponete che i dati su Wi non siano disponibili e che il modello sia stimato omettendo Wi dalla regressione.

  • Supponete che Zi e Wi siano incorrelate. Lo stimatore TSLS è consistente?
  • Supponete che Zi e Wi siano correlate. Lo stimatore TSLS è consistente?

(Stock-Watson) Considerate il modello di regressione yi = β0 + β1xi + ui dove valgono le ipotesi del Teorema di Gauss-Markov. Mostrate che

  • Zi è uno strumento valido
  • Lo stimatore TSLS costruito utilizzando Zi = xi è uguale allo stimatore OLS.

Considerate il modello di regressione Yi = β0 + β1Xi + ui dove Cov(Xi, ui) ≠ 0 e Zi è uno strumento valido. Mostrate che lo stimatore OLS di β1 ottenuto dalla stima della regressione del secondo stadio

yi = β0 + β1i + ui,

dove X̂i sono i valori predetti dalla regressione del primo stadio

i = π0 + π1Zi + vi

è uguale a

β̂1TSLS = ∑ni=1(Zi - Z̅)(Yi - Ŷ) / ∑ni=1(Zi - Z̅)(Xi - X̅).

(Suggerimento: considerate l’espressione per lo stimatore OLS di π1, cioè π̂1, nella regressione del primo stadio, calcolate X̂i e sostituite nell’espressione per lo stimatore OLS di β1 nella regressione del secondo stadio.)

Dipartimento di Scienze EconomicheUniversità di Verona

a.a. 2014/2015

Elementi di EconometriaEsercizi #4

(Stock-Watson) Considerate il modello di regressione yi = β0 + β1xi + β2Wi + ui dove Cov(xi, ui) ≠ 0. Per ciascuno dei seguenti casi indicate se Zi è una variabile strumentale valida:

  • Zi è indipendente da (yi, xi, Wi).
  • Zi = Wi.
  • Zi = xi.

(Stock-Watson) In un modello di regressione con variabili strumentali con un singolo regressore, Xi e due strumenti, Zi1 e Zi2, il valore della statistica J è pari a J = 18.2.

  • Questo suggerisce che Zi1 e Zi2 siano esogeni? Motivate la risposta.
  • Questo suggerisce che Zi1 sia esogeno? Motivate la risposta.

(Stock-Watson) Considerate il modello di regressione Yi = β0 + β1Xi + β2Wi + ui dove Cov(Xi, ui) ≠ 0 e Zi è uno strumento valido. Supponete che i dati su Wi non siano disponibili e che il modello sia stimato omettendo Wi dalla regressione.

  • Supponete che Zi e Wi siano incorrelate. Lo stimatore TSLS è consistente?
  • Supponete che Zi e Wi siano correlate. Lo stimatore TSLS è consistente?

(Stock-Watson) Considerate il modello di regressione yi = β0 + β1xi + ui dove valgono le ipotesi del Teorema di Gauss-Markov. Mostrate che

  • Zi è uno strumento valido
  • Lo stimatore TSLS costruito utilizzando Zi = xi è uguale allo stimatore OLS.

Considerate il modello di regressione Yi = β0 + β1Xi + ui dove Cov(Xi, ui) ≠ 0 e Zi è uno strumento valido. Mostrate che lo stimatore OLS di β1 ottenuto dalla stima della regressione del secondo stadioyi = β0 + β1i + ui,dove X̂i sono i valori predetti dalla regressione del primo stadioXi = π0 + π1Zi + viè uguale a

β̂1TSLS = Σi=1n(Zi - Z̄)(Yi - Ȳ) / Σi=1n(Zi - Z̄)(Xi - X̄)

(Suggerimento: considerate l'espressione per lo stimatore OLS di π1, cioè π̂1, nella regressione del primo stadio, calcolate X̂i e sostituiteli nell'espressione per lo stimatore OLS di β1 nella regressione del secondo stadio.)

1

Considerate il seguente modello per stimare l'effetto del possesso di un personal computer sulla media dei voti alla Laurea:

MediaVotii = β0 + β1PCi + ui

dove PCi è una variabile binaria pari ad 1 se lo studente i-esimo possiede un personal computer e pari a zero altrimenti.

  • Indicate se, a vostro parere, PC può essere correlata con il termine di errore.
  • Indicate se PC può essere correlata con il reddito familiare. Questa correlazione fa del reddito familiare una buona variabile strumentale per PC? Motivate la risposta.
  • Supponete che, tre anni fa, l’Università abbia deciso di fornire a metà degli studenti immatricolati al primo anno un personal computer, scegliendo gli studenti a caso. Spiegate come usereste questa informazione per costruire una variabile strumentale per PC.
  • Spiegate, in dettaglio, se e come è possibile sottoporre a verifica l’ipotesi che la variabile strumentale di cui nel punto precedente sia incorrelata con il termine di errore ui.

Allo scopo di stimare il rendimento dell’istruzione il ricercatore A utilizza un campione di 935 maschi ed il modello

log(wage) = β0 + β1educ (1)

La stima della relazione di cui sopra fornisce i seguenti risultati

log(wage) = 5.97 + (0.059) educ(0.08) (0.005)

Qual è il rendimento di 5 anni addizionali di istruzione?

Il ricercatore B sostiene che gli anni di istruzione sono probabilmente correlati con il termine di errore e suggerisce di usare il numero di fratelli/sorelle (sibs) come variabile strumentale e sostiene che i risultati della regressione

educ = 14.14 - 0.2280.03sibs

confermano la sua ipotesi. Perchè?

Dalla stima TSLS della (1) con sibs come strumento, il ricercatore A ottiene questi risultati

log(wage) = 5.13 + 0.122 educ(0.39) (0.026)

Il rendimento dell’istruzione è statisticamente diverso da zero?

Ora, il ricercatore A sostiene che anche l’ordine di nascita dell’individuo (brthord) può essere utilizzato come variabile strumentale (perchè?) e sostiene che i risultati della regressione

educ = 14.14 - 0.250.04brthord

confermano la sua ipotesi. Perchè?

2

A questo punto il ricercatore B afferma che entrambe le variabili strumentali dovrebbero essere utilizzate nella stima. Da un punto di vista puramente teorico, per quale motivo il ricercatore B ha ragione? (Non sono richiesti calcoli o algebra.)

Spiegate perchè il ricercatore B può riportare il seguente output di stima a sostegno della propria tesi.

educ = 14, 296 (0,133) - 0,1528 sibs (0,0398) - 0,153674 brthord (0,057076)

dove il test F di significatività della regressione vale 26.29.

Il ricercatore A decide allora di utilizzare sia sibs che brthord come strumenti ed ottiene le seguenti stime

log(wage) = 5.05 (0.36) + 0.128 (0.027) educ QUAL è il rendimento di un anno di istruzione? E’ statisticamente diverso da zero?

Indicate (siate espliciti!) se e come può essere sottoposta a verifica l’ipotesi di incorrelazione tra variabili strumentali e termine di errore.

Indicate (siate espliciti!) se e come può essere sottoposta a verifica l’ipotesi di incorrelazione tra il regressore educ e il termine di errore.

Avete a disposizione un campione di 2251 donne residenti in aree urbane dello stato africano del Botswana (i dati sono disponibili in fertility nella cartella Wooldridge in Gretl). Di queste donne sono noti il numero dei figli (children), l’età (age), gli anni d’istruzione (educ), la religione (animista, spirit, protestante, protest, cattolica, catholic, o nessuna religione), la presenza di almeno un televisore (tv) e dell’elettricità (electric) nell’abitazione, ed il mese di nascita. Vi interessa scoprire l’effetto dell’istruzione sulla fecondità. Le stime OLS sulle variabili suddette, e sul quadrato od il cubo dell’età, danno i seguenti risultati (errori standard tra parentesi):

children = 1, 59373 (0,77521) - 0,0733478 (0,0065079) educ - 0, 322975 (0,083483) age + 0, 0201676 (0,0028149) age2

- 0,0002471703 (3,050e-06) age3 + 0, 112515 (0,0555857) spirit + 0, 055804 (0,064874) protest + 0, 0623645 (0,082877) catholic

- 0, 241314 (0,0911730) tv - 0, 295904 (0,0757875) electric

T = 4358 R² = 0, 5781 F(9, 4348) = 664,37 = 1,4432

È inoltre noto che il valore della statistica F del test congiunto di eguaglianza a zero dei coefficienti sulle variabili tv e electric è di 6.17. Sulla base di queste informazioni, si risponda ora alle seguenti domande:

Che interpretazione potete dare al coefficiente su educ, tenendo conto che nella regressione di cui sopra sono incluse variabili quali l’età, la religione, la disponibilità di televisore ed elettricità?

Che effetto hanno il televisore o l’elettricità sulla fecondità? Questo effetto è congiuntamente significativo?

A voi interessa sapere se gli anni d'istruzione sono la causa della riduzione del numero dei figli, non solo se le due variabili sono negativamente correlate. Temete però che il numero di figli e gli anni d'istruzione siano entrambi influenzati da caratteristiche non osservabili. Tenendo conto del modo di operare del sistema scolastico del Paese, decidete quindi di strumentargli anni d'istruzione con una dummy che vale 1 se la donna è nata nella prima metà dell'anno (firsthalf). La regressione OLS di educ sulle altre variabili esplicative della prima regressione e su firsthalf produce le seguenti stime:

educ = 0,624953 + 0,742586 age - 0,0300698 age2+ 0,000318270 age3 (1,7976) (0,19320) (0,0056716) (7,7767e-05) + 0,630291 spirit + 1,85313 protest + 2,21997 catholic + 2,65719 tv (0,12851) (0,14777) (0,18819) (0,20747) + 2,09736 electric - 0,689361 firsthalf (0,17301) (0,10195)

T = 4358 R2 = 0,2742 F(9,4348) = 183,55 σ̂ = 3,3456 (errori standard tra parentesi)

È inoltre noto che il valore della statistica F del test di uguaglianza a zero del coefficiente di firsthalf è pari a 45.72. Che cosa potete dedurre da questi risultati?

I risultati delle stime IV sono di seguito riportati:

children = 1,62471 - 0,250743 age + 0,0172346 age2- 0,000121629 age3 (0,79540) (0,098173) (0,0035067) (3,7561e-05) + 0,174100 spirit + 0,237299 protest + 0,279273 catholic + 0,0221663 tv (0,070194) (0,13778) (0,16740) (0,19857) - 0,0865621 electric - 0,171255 educ (0,15946) (0,065435)

T = 4358 R2 = 0,5585 F(9,4348) = 618,84 σ̂ = 1,4803

Come mai il coefficiente su educ stimato con TSLS è più grande in valore assoluto dello stesso coefficiente stimato con OLS?

Come mai lo standard error del coefficiente su educ stimato con TSLS è più grande dello standard error dello stesso coefficiente stimato con OLS?

Interpretate le stime dei coefficienti. In particolare, tenendo fissa l'età, qual è l'effetto di un anno addizionale di istruzione sulla fertilità? Se 100 donne studiano un anno in più, quanti figli in meno ci attendiamo?

Vogliamo studiare la relazione tra salario e anni di istruzione utilizzando un campione di 513 lavoratori maschi. Stimiamo il seguente modello

ln(wage)i = β0 + β1educi + β2blacki + β3meti + β4southi + β5IQi + β6experi + β7expper2i + ui

dove wage sta per il salario orario in cents, educ sta per gli anni di istruzione, _black è pari a 1 se afro-americano, met è pari a 1 se residente in una grande città, south è pari a 1 se

residente al Sud, IQ è lo score in un test IQ, exper sta per gli anni di esperienza. Il modello è stimato con OLS e IV, gli strumenti esclusi dal modello sono dati dagli anni di istruzione del padre (feduc) e dagli anni di istruzione della madre (meduc). I risultati della stima sono riportati nella tabella (errori standard tra parentesi). Rispondete alle seguenti domande:

  1. gli strumenti sono esogeni? Motivate la risposta.
  2. c’è un problema di strumenti deboli? Motivate la risposta.
  3. dovremmo usare il metodo IV? Motivate la risposta.
  4. sulla base della risposta al punto precedente, qual è il rendimento di un anno addizionale di istruzione? E’ significativamente diverso da zero?
  5. Ritenete che l’omissione dell’abilità individuale all’equazione stimata rappresenti un problema? Motivate la risposta.
Metodo di stima ⟶ OLS IV OLS OLS OLS OLS Variabile dipendente ⟶ lwage wageo rcs.IV rcs.IV lwage educ Variabili esplicative ↓ costante 4.24 4.11 -0.22 -0.22 4.11 12.36 13.79 educ (0.22) (0.18) (0.18) (0.48) 0.47 0.08 (0.78) (0.79) black -0.12 -0.12 -0.003 -0.02 -0.12 -0.02 met 0.15 0.14 0.05 0.15 0.03 0.05 south -0.02 -0.02 -0.001 -0.00 -0.003 -0.02 IQ 0.002 0.002 -0.001 0.002 0.23 0.24 exper 0.09 0.09 0.007 0.006 0.09 -0.59 exper2 -0.002 -0.002 -0.0007 -0.0006 -0.42 -0.5 feduc -0.007 0.00 meduc 0.005 0.10 rcs.1stadio 0.008 SQR 67.27 67.39 67.07 67.36 67.25 1220.3 342.55

Spesa per alcolici. Per un campione di 195 famiglie si vuole studiare la relazione esistente tra la frazione di spesa destinata agli alcolici (V) e quella destinata al tabacco (T) tramite la seguente equazione

ln(V) = β0 + β1ln(T) + β2ln(S) + β3eta + β4eta2 + β5ncomp + u

dove è la spesa totale, eta e eta2 sono l’età e l’età al quadrato del capofamiglia, ncomp è il numero di componenti della famiglia. La tabella alla pagina successiva riporta i risultati

Anteprima
Vedrai una selezione di 3 pagine su 6
Econometria 10 Pag. 1 Econometria 10 Pag. 2
Anteprima di 3 pagg. su 6.
Scarica il documento per vederlo tutto.
Econometria 10 Pag. 6
1 su 6
D/illustrazione/soddisfatti o rimborsati
Acquista con carta o PayPal
Scarica i documenti tutte le volte che vuoi
Dettagli
SSD
Scienze economiche e statistiche SECS-P/05 Econometria

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher Valentino_1995 di informazioni apprese con la frequenza delle lezioni di Econometria e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Verona o del prof Lubian Diego.
Appunti correlati Invia appunti e guadagna

Domande e risposte

Hai bisogno di aiuto?
Chiedi alla community