vuoi
o PayPal
tutte le volte che vuoi
Dipartimento di Scienze Economiche
Università di Verona
Elementi di EconometriaEsercizi Diagnostica
(SOLUZIONI)
-
Esercizi
Supponete di avere a disposizione osservazioni sul salario orario, yi e sugli anni di istruzione, xi, di individui residenti in Veneto, Lombardia e Piemonte. Avete stimato con OLS un modello del tipo
lnyij = β0 + β1xi + ui
per ciascuna regione e per le tre regioni nel loro insieme. Avete ottenuto i seguenti risultati:
- Veneto
- β̂1 0.06
- SE(β̂1) 0.042
- SQR 45
- n 292
- Lombardia
- β̂1 0.05
- SE(β̂1) 0.01
- SQR 32
- n 182
- Piemonte
- β̂1 0.075
- SE(β̂1) 0.034
- SQR 11
- n 232
- Tutte
- β̂1 0.069
- SE(β̂1) 0.024
- SQR 100
- n 706
dove SQR è la somma dei quadrati dei residui nel modello di regressione ed n è la numerosità campionaria.
- Verificate l’ipotesi nulla che i parametri del modello di regressione siano gli stessi nelle tre regioni.
- Assumendo che sub a) sia vero, verificate che la pendenza comune della retta di regressione sia pari ad uno.
Considerate un modello di regressione che vuole spiegare il prezzo delle abitazioni, price, in funzione delle loro caratteristiche: sqrft, la dimensione dell’abitazione; bdrms, il numero di camere da letto; size, l’area del terreno circostante l’abitazione. Il modello da stimare è dato da
price = β0 + β1size + β2sqrft + β3bdrms + u
I risultati di diverse regressioni per un campione di n = 88 osservazioni, relative alle due contee di Gnu (35 osservazioni) e di Gnat (53 osservazioni), sono riassunti nella tabella seguente, dove F-test è il test di significatività della regressione.
- Veneto
Variabili esplicative
costante
size
sqrtft
bdrms
size2
size×sqrtft
size×bdrms
sqrtft2
sqrtft×bdrms
bdrms2
price2
(col. (1))
price3
(col. (1))
n
R2
SQR
F-test
Anche usando GRETL,
- Ottenete gli stimatori OLS di β0 e β1 per lo studente A e per lo studente B.
- Calcolate l'R2 della regressione e s2 sia per lo studente A che per lo studente B.
- Ottenete lo standard error di β0 e β1, sia per A che per B.
- Spiegate perché gli standard error ottenuti dallo studente A sono maggiori di quelli ottenuti dallo studente B.
Un ricercatore, utilizzando un campione di 530 lavoratori (250 maschi e 280 femmine), ha ottenuto i seguenti risultati:
salario = 12.68 + 2.79 M
dove gli SE sono riportati tra parentesi sotto le stime dei coefficienti, R2 = 0.06 e SER = 3.10.
Il salario è misurato in Euro/ora e M è una variabile binaria uguale a 1 se il soggetto è maschio e pari a 0 se femmina.
- Definite teoricamente il differenziale salariale maschio/femmina.
- Quantificate il differenziale salariale maschio/femmina.
- Il differenziale salariale maschio/femmina è significativamente diverso da zero?
- Costruite un intervallo di confidenza al 95% per il differenziale salariale.
- Nel campione, qual è il salario medio dei maschi? e delle femmine?
- Un altro ricercatore usa gli stessi dati ma stima la regressione:
salario = ..... + ...... F
dove F è una variabile binaria uguale ad 0 se il soggetto è maschio e pari a 1 se femmina.
- Calcolate le stime (mancanti) dei parametri.
- La seguente tabella contiene i dati sul punteggio ottenuto ad un test di ammissione (ACT, scala da 1 a 36) al college e sulla media dei voti agli esami (GPA, scala da 0 a 4) per un campione di 8 studenti universitari.
Verificate l'ipotesi nulla che ROS non abbia effetti sul salario contro l'alternativa che l'effetto sia positivo ad un livello di significatività del 10%.
Includereste ROS nella specificazione finale del modello se spiega il compenso del CEO in funzione della performance dell'impresa? Spiegare.
Supponete che la domanda di tè cinese in Italia sia determinata dall'equazione
lnQ = β0 + β1lnPC + β2lnPI + β3lnPB + β4lnY + u
dove Q sta per le importazioni di tè cinese in Italia, PC sta per il prezzo del tè cinese in lire, PI sta per il prezzo del tè indiano in lire, PB sta per il prezzo del caffè brasiliano e Y sta per il reddito disponibile.
Avendo a disposizione un campione di 22 osservazioni, è stata effettuata una prima regressione OLS i cui risultati sono
lnQ = 2.837 – 0.738 lnPC + 0.199 lnPB + 0.257 lnY
dove tra parentesi sono riportati i relativi errori standard.
- Formulate l'ipotesi nulla che conduce alla seconda regressione.
- Sotto l'ipotesi di omoschedasticità, indicate se è possibile rigettare o meno l'ipotesi nulla.
- Quali sono le implicazioni economiche dell'ipotesi nulla (al massimo 10 righe).
Considerate un modello di regressione in cui si vuole spiegare la domanda per trasporto pubblico urbano (autobus) negli U.S.A. in termini di diversi fattori che la possono spiegare. Per ciascuna di 40 città abbiamo osservato, nello stesso istante temporale, le seguenti variabili: bus, migliaia di passeggeri per ora; fare, il costo del biglietto in US$; price, il prezzo della benzina al gallone; inc, il reddito pro-capite in US$; pop, la popolazione in migliaia; dens, la densità della popolazione per miglio2; area, la superficie della città in miglia2. Abbiamo così potuto stimare il modello
bus = β1 + β2fare + β3price + β4inc + β5pop + β6dens + β7area + u
- Utilizzando i dati in “data4-4” nel dataset Ramanathan, stimate con GRETL il modello di regressione di cui sopra.
- Calcolate il test F di significatività della regressione e indicate se è possibile rifiutare l'ipotesi nulla.
- Indicate quali parametri sono statisticamente diversi da zero.
Supponete che u = 0.75, calcolate la media e la deviazione standard di r.
Per quale valore di u si ottiene il più grande valore della media di r? Qual è la deviazione standard di r per questo valore di u?
Quale valore di u minimizza la varianza di r?
Siano X e Z due variabili aleatorie normali standardizzate indipendenti e sia Y = X2 + Z.
Mostrate che:
- E(Y|X) = X2
- E(Y) = 1
- E(XY) = 0
- Cov(X, Y) = 0 e quindi Corr(X, Y) = 0, per cui la media condizionale di Y dipende da X ma X e Y sono incorrelate!
In un’indagine campionaria su 400 potenziali votanti, 215 hanno risposto di aver intenzione di votare per il candidato uscente e 185 per il suo sfidante. Sia p la frazione di potenziali che preferiscono il candidato uscente al tempo dell’indagine e sia p̂ quella degli intervistati che preferiscono il candidato uscente.
- Si usino i risultati dell’indagine per stimare p.
- Si usi lo stimatore della varianza di p̂, p̂(1 - p̂)/n, per stimare l’errore standard dello stimatore.
- Qual è il p-value per H0: p = 0.5 contro H1 ≠ 0.5?
- Qual è il p-value per H0: p = 0.5 contro H1 > 0.5?
- Perché i risultati nei due punti precedenti differiscono?
- L’indagine mostra una evidenza statisticamente rilevante del fatto che il candidato uscente è in testa al tempo dell’indagine? Perché?
- Costruite un intervallo di confidenza al 95% per p.
- Costruite un intervallo di confidenza al 99% per p.
- Considerate la coppia di v.a. (X,Y) con funzione di densità di probabilità (fdp) congiunta data da
Calcolate:
- Pr(Y < 2), Pr(Y > 2, X > 0), Pr(Y = 1, X ≥ 1).
- Le fdp marginali di X e Y.
- La funzione di densità di probabilità di Y dato X = 2.