Elementi di Econometria, a.a. 2014/2015
Dipartimento di Scienze Economiche, Università degli Studi di Verona
Esercizi # 3
DIAGNOSTICA DELLO STIMATORE OLS
Esercizio 1
Si consideri un campione di 4986 famiglie italiane il cui capofamiglia ha meno di 60 anni. Di queste famiglie sono noti la spesa alimentare (food), il numero di componenti (ncomp), la residenza (in centro Italia, centre, o nel Sud, south – i restanti abitano nel Nord Italia), l’età (age), il sesso (female =1 se donna, zero altrimenti) ed il reddito (y).
Si considerino le regressioni (stime OLS) riportate nella tabella seguente, dove la variabile dipendente (ln(food)) è il logaritmo della spesa alimentare, e la variabile \(\hat{\text{ln}}\) in colonna (2) indica il valore predetto della colonna (1).
Var. dipendente (1) ln(food) (2) qt(food) ncomp 0.155 (0.005) -4.003 (1.394) centre 0.019 (0.014) -0.490 (0.171) south -0.023 (0.023) 0.585 (0.285) age 0.034 (0.018) -0.880 (1.029) age^2 0.000 (0.000) 0.002 (0.003) female 0.018 (0.011) -3.244 (1.011) lny 0.114 (0.082) -0.238 (0.090) lny^2 0.010 (0.005) 0.099 (0.066) \(\hat{\text{ln}}\)at 4.324 (1.341) costante 3.686 (0.348) -3.805 (13.145)
Nota: standard error tra parentesi
Sulla base di queste informazioni, rispondete alle seguenti domande:
- Quanto è l’elasticità della spesa alimentare al reddito per una famiglia il cui reddito è 10000 euro? E per una famiglia il cui reddito è 1000 euro?
Dobbiamo guardare alla colonna (1). La formula da applicare è la seguente: ≤i ln(food)/≤i ln(y) = 0.114 + 2*0.010*ln(y) Per y=10000. 0.114 + 2*0.010*ln(10000) = 0.298. Per y=1000. 0.114 + 2*0.010*ln(1000) = 0.252. Quindi: aumentando dell’1% i redditi, la spesa alimentare aumenta dello 0.298% se i redditi sono pari a 10000 euro, e dello 0.252% se i redditi sono pari a 1000 euro.
Elementi di Econometria, a.a. 2014/2015
Dipartimento di Scienze Economiche, Università degli Studi di Verona
Esercizi #3
DIAGNOSTICA DELLO STIMATORE OLS
Si consideri un campione di 4986 famiglie italiane il cui capofamiglia ha meno di 60 anni. Di queste famiglie sono noti la spesa alimentare (food), il numero di componenti (ncomp), la residenza (in centro Italia, centre, o nel Sud, south - i restanti abitano nel Nord Italia), l’età (age), il sesso (female = 1 se donna, zero altrimenti) ed il reddito (y).
Si considerino le regressionii (stime OLS) riportate nella tabella seguente, dove la variabile dipendente (ln(food)) è il logaritmo della spesa alimentare, e la variabile l\hat in colonna (2) indica il valore predetto della colonna (1).
Var. dipendente(1) ln(food)(2) qt(food)ncomp0.155-4.005centre0.019-0.490south-0.0230.585age0.034-0.880age²0.0000.004female0.018(1.029)lny0.114-3.244lny²0.082(1.011)lny³0.0100.238/hat-0.005(0.009)lnhat²4.324(1.341)lnhat³-0.250(0.066)Costante3.686-38.806SQR(0.348)(11.145)Nota: standard error tra parentesi
Sulla base di queste informazioni, rispondete alle seguenti domande:
Quanto è l’elasticità della spesa alimentare al reddito per una famiglia il cui reddito è 10000 euro? E per una famiglia il cui reddito è 1000 euro?
Dobbiamo guardare alla colonna (1). La formula da applicare è la seguente:
∂(lnfood)/∂lny = 0.114 + 2*0.010*lny
Per y = 10000. 0.114 + 2*0.010*ln(10000) = 0.298.
Per y = 1000. 0.114 + 2*0.010*ln(1000) = 0.252.
Quindi: aumentando dell’1% i redditi, la spesa alimentare aumenta dello 0.298% se i redditi sono pari a 10000 euro, e dello 0.252% se i redditi sono pari a 1000 euro.
Si spieghi in cosa consiste il test RESET e come lo si calcola. Nel caso in questione, si indichi se si rifiuta l’ipotesi nulla.
È un test di corretta specificazione. La procedura da seguire è la seguente: a) si determinano i valori predetti della variabile dipendente dalla regressione iniziale; b) si considera una regressione ausiliaria, in cui la variabile dipendente è regressa sulle variabili esplicative in a) e su alcune potenze dei valori predetti in a); c) si verifica con un test F l’ipotesi nulla che i coefficienti associati alle potenze dei valori predetti siano congiuntamente uguali a zero. In questo caso, il test si calcola a partire dalla regressione ausiliaria in colonna (2); sotto H0 (corretta specificazione) tutti i termini in lhat hanno coefficienti nulli. Il test allora è pari a
654.31 – 645.87 4986–11 645.87 2 = 32.51
Dato che N è molto grande, 2*32.51 = 65.02 segue una distribuzione Chi quadro con 2 gradi di libertà. Siccome la soglia critica al 5% è 5.991 e noi otteniamo un valore più grande, rifiutiamo H0. Concludiamo dunque che la specificazione non è corretta.
Come si potrebbe verificare l'ipotesi nulla di stabilità strutturale della relazione, contro l’ipotesi alternativa in cui le stime differiscono fra famiglie con capofamiglia uomo e famiglia donna?
Dovremmo usare un test di Chow. In questo caso l’ipotesi nulla H0 è che è che tutti i coefficienti siano uguali per uomini e donne tranne la costante; l’ipotesi alternativa H1 è che tutti i coefficienti siano diversi. Si stima il modello vincolato (tutto il campione) e si stimano i due modelli di regressione per capofamiglia uomo e capofamiglia donna. Si ottengono le SQR e si costruisce il test F usuale.
Esercizio 2
Abbiamo stimato con OLS il logaritmo del reddito da lavoro pro capite (lnreddito) su di un campione di lavoratori italiani (dati SHIW 2006), come funzione di età/10 ed età/10 al quadrato (eta, eta2), sesso (donna, dummy =1 se donna), istruzione (laurea, dummy =1 se laureato), ed area geografica (sud, dummy =1 se vive al sud). I risultati che abbiamo ottenuto sono riportati nella seguente tabella (standard error tra parentesi):
(1) (2) (3) Campione: Tutti Lavoratori dipendenti Lavoratori autonomi eta 0.391 0.510 0.301 (0.073) (0.085) (0.166) eta2 -0.026 -0.041 -0.018 (0.008) (0.009) (0.017) donna 0.132 -0.139 (0.021) (0.027) (0.130) laurea 0.461 0.448 0.473 (0.028) (0.029) (0.167) sud -0.158 -0.153 -0.179 (0.079) (0.087) (0.198) costante 8.209 8.926 7.975 (0.166) (0.188) (0.404)Sulla base di queste informazioni, rispondete alle seguenti domande:
- Usando il campione di tutti i lavoratori, si calcolino le variazioni percentuali di reddito derivanti rispettivamente dall'essere donna, dall'essere laureato, e dal vivere al sud. Questi effetti sono significativamente diversi da zero? Gli effetti sono rispettivamente -15.2%, +46.1%, -15.5%; tutti sono significativi.
- L’effetto potrebbe essere diverso tra lavoratori autonomi e dipendenti. Si conduca un test di Chow per testare questa ipotesi.
Possiamo calcolare il test di Chow a partire dalle SQR delle tre regressioni:
Per n grande, il test segue una distribuzione Chi quadro con 6 gradi di libertà (pari cioè al numero di parametri nel modello sotto H0). Il valore critico al livello del 5%, corrispondente a questa distribuzione, è 12.592. Siccome la statistica vale più di 12.592, rifiutiamo H0 e concludiamo che l’effetto è diverso tra lavoratori autonomi e lavoratori dipendenti.
- Esiste un modo alternativo per condurre il test di Chow a partire da un’altra regressione?
Otterremmo lo stesso risultato confrontando le SQR in colonna (1) con le SQR di una regressione in cui tutte le variabili esplicative sono interagite con una variabile binaria che vale 1 se il lavoratore è autonomo e 0 se il lavoratore è dipendente (o viceversa).
Esercizio 3
Si consideri un campione di 2464 uomini lavoratori britannici, nati nel 1958, di cui sono noti gli anni d'istruzione (educ), l’esperienza lavorativa (exp) ed il salario orario in sterline (wage) nel 1991. Sono inoltre noti i risultati dei test di abilità verbale (qvab) e matematica (qmab) sostenuti nel 1965. Definiamo la variabile (abil)=qmab+qvab. Si consideri la regressione (stime OLS) riportata nella tabella seguente, dove educ2 è il quadrato di educ, SE è una variabile binaria che indica la residenza nel Sud Est del paese, scot è una variabile binaria che indica la residenza in Scozia. Sappiamo inoltre che la statistica test di White è in questo caso pari a 1.407.
Var. dipendente
(1)
wage
- educ 3.316 (0.349)
- educ2 -0.092 (0.012)
- exp 0.301 (0.039)
- abil 0.324 (0.048)
- qvab -0.121 (0.085)
- SE 1.504 (0.133)
- scot -0.215 (0.199)
- costante -24.604 (2.527)
SQR 201811.173
Nota: standard error tra parentesi
Sulla base di queste informazioni, rispondete alle seguenti domande:
-
Come possiamo interpretare il coefficiente su scot? Guardando anche al suo standard error, cosa possiamo concludere?
Il coefficiente su scot indica che il salario medio dei residenti in Scozia è, a parità di istruzione, esperienza ed abilità, di 0.215 sterline inferiore a quello dei residenti nel resto del Paese (ma non nel Sud Est).
Il coefficiente non è tuttavia statisticamente diverso da 0, come dimostra il test t = 0.215/0.199 = 1.080 (rapporto fra coefficiente e standard error) che, in valore assoluto, è inferiore a 1.96.
-
Quanto è l’effetto sul salario di un anno aggiuntivo d’istruzione, a parità di esperienza e di abilità verbale e matematica, per un uomo con 10 anni di istruzione? E per un uomo con 15 anni d’istruzione?
Nella specificazione l’istruzione compare attraverso un polinomio quadratico. L’effetto marginale è definito dalla derivata:
- dwage/deduc = 3.316 - 2*0.092*educ
L’effetto dipende dagli anni di istruzione.
Per educ = 10, 3.316 - 2*0.092*10 = 1.476.
Per educ = 15, 3.316 - 2*0.092*15 = 0.556.
Un anno aggiuntivo di istruzione fa crescere il salario di 1.292 sterline dopo 10 anni di istruzione, e di “solo” 0.556 sterline dopo 15 anni di istruzione.
Potete rifiutare l'ipotesi nulla che abilità matematica e verbale hanno lo stesso effetto sul salario?
Scriviamo il modello in cui gli effetti di qmab e qvab sono diversi:
yi = β0 + β1educi + β2educ2i + β3expi + β4abili + β5gvabi + β6SEi + β7scoti + ui
= β0 + β1educi + β2educ2i + β3expi + β4 (qmab + qvab) + β5gvabi + β6SEi + β7scoti + ui
= β0 + β1educi + β2educ2i + β3expi + β4qmab + (β4 + β5)qvab + β6SEi + β7scoti + ui
e sotto H0: β*4 = β4 + β5, cioè H0: β5=0.
Quindi l'ipotesi nulla è vera se il coefficiente su qvab nell'equazione stimata non è diverso da zero. In questo caso abbiamo un test t = -0.121/0.085 = -1.424 che, in valore assoluto, è inferiore a 1.96. Dunque il test t non rifiuta l'ipotesi nulla, e non possiamo rifiutare l'ipotesi che abilità matematica e verbale abbiamo lo stesso effetto sul salario.
Si spieghi in cosa consiste il test di White e come lo si calcola. Nel caso in questione, se ne calcolino i gradi di libertà e si indichi se il test rifiuta l'ipotesi nulla.
Si tratta di un test per verificare l'ipotesi nulla di omoschedasticità contro l'ipotesi alternativa di eteroschedasticità di forma ignota. Si calcola a partire dalla regressione dei quadrati dei residui sulle variabili esplicative, i loro quadrati e prodotti incrociati non ridondanti. La statistica è il test F di significatività di questa regressione ausiliaria. Il numero di restrizioni è pari al numero di tutte le variabili esplicative nella regressione eccetto la costante. Per campioni grandi, la statistica moltiplicata per il numero di restrizioni si distribuisce sotto H0 come una chi quadro con gradi di libertà pari al numero di restrizioni.
In questo caso le restrizioni sono 31, (si ricordi che abil e qvab sono variabili continue, mentre SE e scot sono variabili binarie, Si noti che il prodotto SE*scot = 0 perchè nessuno può essere residente in Scozia e nel SudEst contemporaneamente).
Quindi 31*(1.407) = 43.617 segue una distribuzione Chi quadro con 31 gradi di libertà. La soglia critica al 5% per 31 gradi di libertà è 44.98. Siccome la nostra statistica è inferiore alla soglia critica, accettiamo l'ipotesi nulla a qualunque livello di significatività. Concludiamo dunque per la presenza di omoschedasticità.
Esercizio 4
Disponiamo di un campione di 3113 famiglie residenti negli Stati Uniti (i dati sono tratti dall'indagine Survey of Consumer Finances per il 2007), di cui sono noti il valore monetario dell'abitazione di residenza (in logaritmi, lnhous), ed il reddito familiare (in logaritmi, lninco), oltre al numero di componenti della famiglia (mmembers), età (age), ed istruzione (graduate, dummy =1 se laureato) del capofamiglia.
Si considerino le seguenti regressioni (stime OLS, standard error tra parentesi), dove res2 è il quadrato dei residui della regressione nella prima colonna, e lnhoushat indica il valore di lnhous-predetto usando la regressione nella prima colonna.
Variabile dipendente:
- lninc 0.470 (0.015)
- lnmembers 0.106 (0.015)
- age 0.025 (0.001)
- graduate 0.727 (0.039)
- lnhoushat -5.058 (0.890)
- lnhoushat 0.185 (0.034)
- costante 5.503 (0.195)
Test F di significatività della regressione 59.478 28.017
SQR 3.435 1.018
Nota: standard error tra parentesi
Sulla base di queste informazioni, rispondete alle seguenti domande:
Qual è l'elasticità al reddito del valore dell'abitazione? Questa elasticità è significativa?
L'elasticità è 0.47, cioè: ad un incremento di reddito dell'1% corrisponde un incremento del valore dell'abitazione dello 0.47%. Questo effetto è significativo, in quanto la statistica t vale 0.470/0.015 = 31.33.
Qual è l'effetto sul valore dell'abitazione di avere un componente aggiuntivo nella famiglia? Questo effetto è significativo?
Un componente in più nella famiglia porta il valore dell'abitazione (e così la sua dimensione) ad aumentare del 10.6%. Anche in questo caso, l'effetto è significativo in quanto la statistica t vale 0.106/0.015 = 7.067.
Si calcoli il test di White nella forma asintoticamente equivalente, concludendo se si trova evidenza di eteroschedasticità.
Il test coincide con il test F di significatività della regressione in colonna (2). Avendo un campione con molte osservazioni, sappiamo che 2*28.017=56.034 segue una distribuzione Chi quadro con 2 gradi di libertà. Il corrispondente valore critico al 5% è 5.991. Il test in questo caso è molto più grande del valore critico, per cui rifiutiamo l'ipotesi nulla e concludiamo che è presente eteroschedasticità nei dati.
Sappiamo che il test di White nella forma esatta vale 23.515. Si indichino i suoi gradi di libertà (spiegando come sono stati determinati) e si concluda se il test suggerisce che sia presente eteroschedasticità.