Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
PRINCIPLES OF ECONOMETRICS
Calcolo del valore atteso
L'idea è che noi abbiamo definito una relazione che vale nella popolazione (modello lineare), ma noi non conosciamo tutta la popolazione per cui abbiamo a che fare con un campione di individui. Quel campione può essere o non essere rappresentativo della popolazione, e può portarci a stime che sono più o meno vicine al valore del parametro della popolazione. Noi ragioniamo in termini di valore atteso, quindi calcoliamo il valore atteso di OLS.
Faremo delle assunzioni SLR (Simple Linear Regression) sul modello:
- Assunzione "Linear in Parameters" (linearità dei parametri): nella popolazione, il modello segue una funzione lineare. Quindi il modello della popolazione è:
y = b0 + b1x
, doveb0
eb1
sono i parametri incogniti della popolazione. - Assunzione "Random Sampling": abbiamo estratto un campione casuale di dimensione
n
, e assumiamo che questo campione segua lo stesso modello della popolazione.
è la costante stessa). Il valore atteso di una somma è uguale alla somma dei valori attesi, quindi la seconda parte si può riscrivere come:
wi sarebbero tutti i termini in x, ma siccome abbiamo detto che le x sono fisse in differenti campioni, significa che le x sono costanti e le posso portare fuori dal valore atteso. Quindi quest'ultima espressione la posso scrivere come:
Ma il valore atteso di ui è uguale a 0, quindi otteniamo:
(Lo stimatore ha questa proprietà, non la stima).
LEZIONE 12.
Prime righe del file Class_2_sp su R quest'ultima cosa su R, generando dei datiVediamo random e dimostrando che se ripetiamo la generazione di una serie di coefficienti, i coefficienti stimati in media hanno quasi esattamente il valore di b0 e b1.
Riprendiamo dalla quarta assunzione fatta alla scorsa lezione.
4. Assunzione "Zero Conditional Mean": nella popolazione, il termine di errore ha media condizionale uguale a 0 e, quindi il valore atteso del
Termine di errore, date le x, è uguale a 0 per tutti i valori di x. Ci sono diversi casi in cui questa ipotesi potrebbe non essere vera, ad esempio se ci fossero dei fattori omessi dal modello, che normalmente sono importanti per spiegare y (attraverso il nesso di causalità con x), porterebbe al fallimento della quarta ipotesi e il modello OLS sarebbe parziale.
ESEMPIO di fallimento dell'ipotesi: valori OLS della performance degli studenti di una scuola superiore e dei criteri di valutazione dei professori degli studenti (=math4 da 0 a 100 che misura il risultato di un esame di matematica).
Il valore ptr è il numero degli studenti per insegnanti e ci serve perché quando la classe è piccola la performance degli studenti dovrebbe essere migliore. Sappiamo che, cioè per ogni studente in meno nella classe la percentuale di successo nel quiz math4 è di 0.64 punti percentuali. Una diminuzione della deviazione standard (intorno a 2.7) nei
ptr porta all'aumento della possibilità di passare l'esame di 0.064(2.17) = 0.17 in punti percentuali. In questo caso non si può stabilire se ci sono fattori in u correlati con la x, ma si tratta di ragionare su tutti i fattori che possono essere correlati con la x e vedere se l'esclusione di queste variabili dal modello può essere problematica per la quarta assunzione che renderebbe l'OLS biased. Però questa è una considerazione che non può essere verificata empiricamente ed è per questo che la quarta assunzione è contestabile. Abbiamo ora un modo per calcolare, attraverso le quattro proprietà, la veridicità dell'OLS. Potremmo avere necessità di una misura della dispersione nella distribuzione semplice degli estimatori: questa misura è la varianza. Finora abbiamo definito 4 proprietà e abbiamo stabilito che se sono vere, l'OLS è unbiased (imparziale). Una volta che
stabiliamo se lo stimatore è unbiased, c'è la proprietà di efficienza dello stimatore da verificare. La prossima volta vedremo che l'OLS è unbiased ed è anche efficiente.LEZIONE 13.
Il fatto di essere unbiased non è sufficiente, perché dobbiamo avere anche una misura della dispersione nella distribuzione semplice degli stimatori, che ci viene data dalla varianza.
Se abbiamo due stimatori unbiased, tra i due se conosciamo la varianza sceglieremo quella più ridotta, poiché c'è maggiore probabilità di essere vicini al valore vero del parametro della popolazione.
Per poter calcolare la varianza dello stimatore OLS dobbiamo aggiungere una assunzione: omoschedasticità o varianza costante: in cui diciamo che la varianza dell'errore date le x è sigma al quadrato (che non conosciamo), indipendente dai valori delle x:
Da cui possiamo dire che: (il valore atteso di u al quadrato è sigma
alquadrato). Le cinque ipotesi insieme implicano che:
Discutiamo la ragionevolezza di questa ipotesi: supponiamo che y = sav (risparmio) e x = inc (reddito), dove il valore atteso del risparmio dato il reddito è una funzione lineare del reddito e ci aspettiamo che beta1 > 0. La varianza del risparmio dato il reddito è costante ed è:
Ma non è sempre così, ad esempio per persone che hanno reddito alto non possiamo dire che tutto ciò che non va in inc va in sav, dipende dalla capacità di risparmio della famiglia. Ripassando dalla prima alla quinta assunzione diremo che: (lasciamo perdere la seconda espressione)
Vediamo da dove arriva la prima espressione: questa espressione la otteniamo prendendo due formule: le w sono in funzione (dipendenti) con x.tutte Abbiamo detto che: (la varianza di una sommatoria quando le variabili sono dipendenti tra di loro è pari alla sommatoria delle varianze), dove Var(wi ui) è uguale a, quindi la
varianza di beta1 cappello diventa Var(beta1 hat) = .Dove: , quindi Var(wi ui) è uguale a , ma siccome, potremo scrivere che è uguale a e infine diremo che è ugualea .Dunque:Se cresce la varianza dell'errore anche la varianza di beta1 heat aumenta,mentre se aumenta la varianza di SSTx aumenta, la varianza di beta1 heat diminuisce (quindi se abbiamo una n grande in virtù di questo si riduce la varianza dell'OLS diun rate di 1/n)SSTx sappiamo che è la devianza di x, e:Aggiustiamo la formula per i gradi di libertà:Una volta che rimpiazziamo questo sigma quadrato cappello nella formula della varianzaotteniamo una varianza stimata di beta1 heat:Solitamente siamo abituati a calcolare anche la deviazione standard, che sarebbe:e se rimpiazziamo questa espressione con la radice quadrata della varianzastimata otteniamo lo standard error:Come facciamo a stimare la varianza dell'errore? Attraverso i residui:Una volta stimata la inseriamonell'espressione della varianza dell'OLS e possiamo calcolare il standard error. Proviamo ora a fare due esercizi:- a) 98.07 e 98.07 - 0.235*20 inclinata negativamente e quindi il peso andrà a decrescere. → retta
- b) No, le sigarette fumate in media non hanno un nesso di casualità con il peso del bambino, perché siccome stiamo studiando un modello di regressione lineare non stiamo considerando tutti gli altri fattori che sono altrettanto importanti se non di più, e non essendo esplicitamente messi nel modello fanno sì che il nesso di causalità sia veramente difficile da stabilire con un modello come questo.
- c) dovrebbe essere un numero negativo, il che non è possibile perché deve essere minimo 0, quindi
LEZIONE 14.
Esercizio 1 da svolgere su R:
Esercizio 2 da svolgere su R:
Esercizio 3 da svolgere su R:
LEZIONE 15.
Modello di regressione lineare multipla
Oggi iniziamo il .
Esempio 1: fino adesso abbiamo considerato la relazione tra wage ed education, adesso consideriamo l'estensione di questo modello e includiamo nel modello una ulteriore variabile, ovvero l'IQ (=quoziente intellettivo). Il vantaggio di includere IQ è che di fatto la escludiamo dal termine di errore, dunque se IQ è una buona proxy per l'intelligenza dell'individuo, il fatto di averla inclusa del modello, crea una stima del modello dell'educazione più realistica.
Esempio 2: relazione tra perdere delle classi (=non seguire le lezioni) e il punteggio dell'esame finale. Consideriamo una variabile che tiene conto dell'abilità degli studenti, che può ess