vuoi
o PayPal
tutte le volte che vuoi
Dipartimento di Scienze Economiche
Università di Verona
Elementi di Econometria
Esercizi #5
Soluzione (traccia)
Naturalmente, tutte le risposte vanno adeguatamente motivate con riferimento alla teoria
- Titanic
- Congruenza, eteroschedasticità, linearità
- A parità di tutto il resto, il coefficiente della dummy 2a classe rappresenta la differenza nella probabilità di sopravvivenza tra seconda e prima classe, è pari a -0.60 ed è significativo in quanto il test t vale -4.82 con un p-value quasi nullo. A parità di tutto il resto, il coefficiente della dummy 3a classe rappresenta la differenza nella probabilità di sopravvivenza tra terza e prima classe, è pari a -1.08 ed è significativo in quanto il test t vale -9.62 con un p-value quasi nullo.
Probabilità sopravvivenza in terza classe: Prob(yii = 1|2aclasse = 0, 3aclasse = 1, femmina = 0, n.fratelli = 0, n.genitori = 0, bambino = 0) = Φ(-0.168371 - 1.08241) = Φ(-1.250781) = 0.105
Probabilità sopravvivenza in prima classe: Prob(yii = 1|2aclasse = 0, 3aclasse = 0, femmina = 0, n.fratelli = 0, n.genitori = 0, bambino = 0) = Φ(-0.168371) = 0.433
Variazione nella probabilità: 0.433 - 0.105 = 0.328
Hit-ratio: (526+296)/1046= 78.58%;
- Frazione successi correttamente predetti: 296/427= 0.693
- Frazione fallimenti correttamente predetti: 526/619=0.849
Nel complesso: 0.849-0.693=1.542
Dataset SMOKE
Modello 1: OLS, usando le osservazioni 1-807 Variabile dipendente: smoke Errori standard robusti rispetto all'eteroschedasticità, variante HC1
Coefficiente Errore Std. rapporto t p-value const 0.656061 0.864080 0.7593 0.4479 lcigpric -0.0698257 0.208034 -0.3313 0.7405 lincome 0.0121261 0.0258232 0.4710 0.6378 educ -0.0288802 0.00564028 -5.1187 0.0000 age 0.0198158 0.00541149 3.6618 0.0003 agesq -0.000259787 5.71332e-05 -4.5740 0.0000 restaurn -0.100762 0.0376902 -2.6734 0.0077 white -0.0256801 0.0506904 -0.5066 0.6126Media var. dipendente 0.384139 SQM var. dipendente 0.486693 Somma quadr. residui 179.0809 E.S. della regressione 0.473425 R2 0.061996 R2 corretto 0.053778 F(7, 799) 10.59397 P-value(F) 8.71e-13 Log-verosimiglianza -537.6197 Criterio di Akaike 1091.239 Criterio di Schwarz 1128.786 Hannan-Quinn 1105.657
1
Modello 2: Probit, usando le osservazioni 1-807
Variable dipendente: smoke
- Coefficiente
- Errore Std.
- z
- p-value
- const 0.471762 2.34327 0.2014 0.8404
- lcigprice -0.280055 0.557502 -0.3732 0.7090
- lincome 0.0302134 0.0708360 0.4265 0.6697
- educ -0.0834483 0.0167997 -4.9672 0.0000
- age 0.0625819 0.0166550 3.7581 0.0002
- agesq -0.000281858 0.000168726 -4.0144 0.0001
- restaurn -0.280674 0.111115 -2.5246 0.0100
- white -0.0765844 0.142895 -0.5359 0.5920
Media var. dipendente 0.384139 SGM var. dipendente 0.378946
R2 di McFadden 0.051344 R2 corretta 0.036460
Log-verosimiglianza -509.9080 Criterio di Akaike 1035.816
Criterio di Schwarz 1073.363 Hannan–Quinn 1050.234
Numero dei casi 'previsti correttamente'= 501 (62.1 percent)
Test del rapporto di verosimiglianza: χ2(7) = 55.195 [0.0000]
Per il MPL si ha -0.02888**= -0.11552. Per il modello probit è necessario fissare dei valori per le variabili esplicative, la risposta non si può dare in generale.
Nel caso del MPL: -0.01989158-2*0.000259787*age-0. = age=38.13; anche per il modello probit: -0.0625019-2*0.000281858*ageo.–age=38.081
quando uno stato introduce il divieto di fumo questo giudice la probabilità di fumare.
Nel tuo circa secondo HTPL) per il modello Probit è necessario fissare dei valori per le variabili esplicative. Tuttavia, siccome il segno dei coefficienti è negative possiamo dire che l'introduzione del divieto fa diminire la probabilità di fumare.
Per il modello di probabilità lineare: 0.656061 -0.0689257* log(67.44) + 0.01211621*log(6500) - 0.0288802*16 + 0.0198158*77 - 0.000259787*77*77=-0,00437031, oops... probabilità negativa!
Dataset MROZ
MPL:
Modello 3: OLS, usando le osservazioni 1-753
Variable dipendente: inlf
Errori standard robusti rispetto all'eteroschedasticità, variante HC1
- Coefficiente
- Errore Std.
- rapporto t
- p-value
- const 0.585519 0.152260 3.8455 0.0001
- nwifeinc -0.00340517 0.00152493 -2.2330 0.0258
- educ 0.0379953 0.00726604 5.2292 0.0000
- exper 0.0394924 0.00581002 6.7793 0.0000
- expersq -0.000596312 0.00019004 -3.1384 0.0018
- age -0.0160908 0.00239901 -6.7073 0.0000
- kidslt6 -0.261810 0.0317832 -8.2374 0.0000
- kidsge6 0.0130122 0.0135329 0.9615 0.3366
2
Sappiamo che
β̂1T SLS = ∑i=1n(yi − ȳ)(x̂i − x̄)/∑i=1n(x̂i − x̄)2
e che, dalla stima OLS della regressione del primo stadio xi = π0 + π1zi + vi si ottiene
π̂0 = x̄ − π̂1z̄
π̂1 = ∑i=1n(xi − x̄)(zi − z̄)/∑i=1n(zi − z̄)2
Dall'algebra OLS si ricava che
x̂i = π̂0 + π̂1zi
x̄̂ = π̂0 + π̂1z̄
(x̂i − x̄̂) = π̂1(zi − z̄)
Sostituendo (x̂i − x̄̂) nell'espressione per β̂1T SLS si ottiene
β̂1T SLS = ∑i=1n(yi − ȳ)(x̂i − x̄̂)/∑i=1n(x̂i − x̄̂)2
= ∑i=1n(yi − ȳ)(zi − z̄)π̂1/∑i=1n(zi − z̄)2π̂12
= ∑i=1n(yi − ȳ)(zi − z̄)/∑i=1n(zi − z̄)2π̂1
Sappiamo (vedi sopra) che
π̂1 = ∑i=1n(xi − x̄)(zi − z̄)/∑i=1n(zi − z̄)2
per cui, sostituendo al denominatore per π̂1, possiamo scrivere
β̂1T SLS = ∑i=1n(yi − ȳ)(zi − z̄)/∑i=1n(xi − x̄)(zi − z̄)π̂1
= ∑i=1n(yi − ȳ)(zi − z̄)/∑i=1n(xi − x̄)2·∑i=1n(zi − z̄)2
= ∑i=1n(yi − ȳ)(xi − x̄)/∑i=1n(xi − x̄)2(zi − z̄)
Forse sì, perché la media dei voti potrebbe essere legata al reddito o all'istruzione della famiglia, che a loro volta potrebbero essere legate al possesso del PC. Siccome il modello esclude reddito ed istruzione dalla specificazione, questi confluiscono nell'errore che di conseguenza potrebbe essere correlato con la variabile PC.
Se un reddito maggiore indica maggiori opportunità di apprendimento, dovremmo aspettarci che il reddito sia correlato con la media voto e che quindi dovrebbe comparire come variabile esplicativa più che come variabile strumentale.
Potremmo definire una variabile dummy pari a 1 se si è ricevuto il PC tramite l'università, e 0 altrimenti.