Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
5.1
Si suppone che un ricercatore, usando i dati sulla dimensione delle classi (CS) e il punteggio medio nei test per 100 classi di terza elementare, stimi la regressione OLS,
^
TESTSCORE = 520,4 - 5,82 x CS
R2 = 0,08
SER = 11,5
- Si costruisca un intervallo di confidenza di livello 95% per β1, la pendenza della regressione
^
β1 - 1,96 * SE(β1)
- 5,82 - 1,96 * 2,21 =
= -10,15
^
β1 + 1,96 * SE(β1)
- 5,82 + 1,96 * 2,21 =
= -1,49
- b) Si calcoli il P-VALUE di un test bilaterale per l'ipotesi nulla H0: β1 = 0. Si rigetta l'ipotesi nulla al livello di significatività del 5%? Al livello dell'1%?
H0 : β1 = 0
H1 : β1 ≠ 0
P-VALUE = 2Ф(-|t*|)
t* = (β1 - 0) / SE(β1)
t* = -5,82 - 0 / 2,21 = -2,63
P-VALUE = 2Ф(-2,63) = 2 * ( -2,63 ) = 2 * 0,0063 = 0,0126
P-VALUE < 5%. Rigetto l'ipotesi nulla
Il coefficiente β1 è diverso da zero, quindi la class size è rilevante nel determinare il TESTSCORE.
9) Si calcoli il P-VALUE per un test bilaterale per l’ipotesi nulla
H0: β1 = 5.6
Senza calcoli aggiuntivi si determini se 5.6 è contenuto nell’intervallo di confidenza al 95% per β1.
H0: β1 = 5.6
H1: β1 ≠ 5.6
t* = ( -5.82 + 5.6 ) / 2.21 = -0.0995
P-VALUE = 2(φ(|t*|)) = 2 φ(-0.099)
P-VALUE = 0.4204
P-VALUE > 5% => non infitto l’ipotesi nulla
10) Si costruisce un intervallo di confidenza al 99% per β0
β0 - 1.96 * SE(β̂0) = 520.4 - 1.96 * 20.4 = 480.42
β0 + 1.96 * SE(β̂0) = 520.4 + 1.96 * 20.4 = 560.38
5.2 Si supponga che un ricercatore, utilizzando i dati su 250 lavoratori maschi selezionati casualmente e 280 femmine, stimi le equazioni: OLS
WAGE = 12.52 + 2.12 x MALE
MALE
1 = maschio
0 = femmina
WAGE = 12.52 + 2.12 x 1 = 14.64
WAGE = 12.52 + 2.12 x 0 = 12.52
Si calcoli il R2 per ognuna delle regressioni.
Regressione 1-D
- 4000-1
- (1-0.176)=0.176
Regressione 2-D
- 4000-2-1
- (1-0.190)=0.189
Regressione 3-D
- 4000-3-1
- (1-0.194)=0.193
(6.1) Usando i dati della colonna 1:
- I lavoratori laureati, in media guadagnano più dei lavoratori con solo il diploma? Quanto più? Un lavoratore laureato guadagna 5.46 $ in più (all'ora) di un lavoratore diplomato.
- In media gli uomini guadagnano più delle donne? Quanto di più? Un uomo guadagna 2.64 $ in più rispetto ad una donna, a parità di altre condizioni.
(6.2) Usando i risultati delle regressione nella colonna 2:
- L'età è una determinante importante delle retribuzioni? Sì, perché un anno in più di età permette di guadagnare 0.29 $ all'ora in più
- Sally è una donna laureata di 29 anni e Betty è una donna laureata di 34 anni. Si predicono le retribuzioni di Sally e di Betty.
ΔHESally=4.40 + 5.40 × 1 + (-2.62) × 1 + 0.29 × 29 = 15.67 $
ΔHEBetty=4.40 + 5.40 × 1 + (-2.62) × 4 + 0.29 × 34 = 17.12 $
Intervallo di confidenza dell'1%.
- Limite inferiore → β3 - 2.58 SE(β3) = 0.29 - 2.58 · 0.04 = 0.19
- Limite superiore → β3 + 2.58 SE(β3) = 0.29 + 2.58 · 0.04 = 0.39
(7.5) La regressione mostrata nella colonna 2 è stata stimata nuovamente usando dati relativi al 1992 (4000 osservazioni).
- AHE = 0.27 + 5.29 COLLEGE + 2.51 FEMALE + 0.40 AGE
- (0.96) (0.21) (0.18) (0.03)
- SER = 5.85
- R2 = 0.21
Paragonando questa regressione a quella della colonna 2, si evidenzia una variazione statisticamente significativa del coefficiente di COLLEGE?
H0: β1, 1998 - β1, 1992 = 0
H1: β1, 1998 - β1, 1992 ≠ 0
t* = (β̂1, 1998 - β̂1, 1992) - 0 / SE(β̂1, 1998 - β̂1, 1992)
SE(β̂1, 1998 - β̂1, 1992) = √(SE(β̂1, 1998))2 + (SE(β̂1, 1992))2 =
= √(0.21)2 + 0.202 = 0.29
t* = 5.98 - 5.29 - 0 / 0.29 = 0.655 / 172
(|t*| < 1.96) → accetto H0
B) Del confronto tra le colonne 1, 2, si ritiene che sia meglio usare SIZE o ln(SIZE) per spiegare il prezzo delle abitazioni?
C) Usando la colonna (2), qual è l'effetto stimato sul prezzo della presenza di una piscina (si faccia attenzione a utilizzare l'unità di misura corretta)? Si costruisca un intervallo di confidenza al 95% per questo effetto.
APool ≠ 1 (perché è una variabile binaria)
ΔPRICE = 100/β2 APool
- 100 ⋅ 0.071 ⋅ 1 = (100 ⋅ 0.071 ⋅ 1)/- 7.1%
Il prezzo delle case aumenta del 7.1% se è presente la piscina tenendo costanti gli altri fattori.
100 ⋅ (β̂ 2 + 1.96 ⋅ SE (β̂ 2)) ⋅ APool
100 ⋅ (0.071 + 1.96 ⋅ 0.034) ⋅ 1 = 13.764%
D) La regressione della colonna 3 aggiunge il numero delle camere da letto alle altre variabili. Qual è l'effetto stimato di una camera da letto in più? Questo effetto è statisticamente significativo? Perché l'ho stimato è così piccolo?
ln[PRICE] = β0 + β1 ln[SIZE] + β2 Pool + β3 VIEW + β4 CONDITION + β5 BEDROOM
ΔBDR = 1
ΔPRICE = 100/β3 ΔBDR
(100 ⋅ 0.0036 ⋅ 1)/- = 0.36%
H0: β3 = 0
H1: β3 ≠ 0
t = (β̂ 3 - β3) / SE (β3) = 0.0036 - 0 / 0.034 = 0.097
Non rigetto l'ipotesi nulla. β3 non è significativamente diverso da zero.
Nella regressione si inserisce una dummy:
OVEST = 0 se la sede è occidentale1 se la sede si trova ad est
FATALITYRATEit = β1 BEERTAXit + β2 DAL18it + β3 DAL19it + β4 DAL20it + β5 JAILit ++ β6 sull male it + β7 unemploymentit + β8
10.4
Usando la regressione Yit = β0 + β1 Xit + γ2 D2i + ... + γn Dni + uit
quali sono la pendenza e l'intercetta per:
- L'unità 1 nel periodo 1?Intercetta: β0, Pendenza: β1
- L'unità 1 nel periodo 3?Intercetta: β0, Pendenza: β1 [perché non ci sono Dummy temoreal]
- L'unità 3 nel periodo 1?Intercetta: β0 + γ3, Pendenza: β1
- L'unità 3 nel periodo 3?Intercetta: β0 + γ3, Pendenza: β1
10.5
Si considera il modello con un singolo regressore Yit = β1 X1, it + αi + λt + + μit tale modello può essere scritto anche come:
Yit = β0 + β1 Xit + δ B2i + ... + δ Bi + ... + γn Dni + μit
dove B2i = 1 se t = 2, 0 altrimenti; D2i = 1 se i = 2 e 0 altrimenti
e così via. Qual è la relazione tra i coefficienti (β1, δi, ... , δn) per(γn) e i coefficienti (αi, ... , αn, λy, λx)?