Anteprima
Vedrai una selezione di 15 pagine su 66
Econometria Pag. 1 Econometria Pag. 2
Anteprima di 15 pagg. su 66.
Scarica il documento per vederlo tutto.
Econometria Pag. 6
Anteprima di 15 pagg. su 66.
Scarica il documento per vederlo tutto.
Econometria Pag. 11
Anteprima di 15 pagg. su 66.
Scarica il documento per vederlo tutto.
Econometria Pag. 16
Anteprima di 15 pagg. su 66.
Scarica il documento per vederlo tutto.
Econometria Pag. 21
Anteprima di 15 pagg. su 66.
Scarica il documento per vederlo tutto.
Econometria Pag. 26
Anteprima di 15 pagg. su 66.
Scarica il documento per vederlo tutto.
Econometria Pag. 31
Anteprima di 15 pagg. su 66.
Scarica il documento per vederlo tutto.
Econometria Pag. 36
Anteprima di 15 pagg. su 66.
Scarica il documento per vederlo tutto.
Econometria Pag. 41
Anteprima di 15 pagg. su 66.
Scarica il documento per vederlo tutto.
Econometria Pag. 46
Anteprima di 15 pagg. su 66.
Scarica il documento per vederlo tutto.
Econometria Pag. 51
Anteprima di 15 pagg. su 66.
Scarica il documento per vederlo tutto.
Econometria Pag. 56
Anteprima di 15 pagg. su 66.
Scarica il documento per vederlo tutto.
Econometria Pag. 61
Anteprima di 15 pagg. su 66.
Scarica il documento per vederlo tutto.
Econometria Pag. 66
1 su 66
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

PRINCIPLES OF ECONOMETRICS

Calcolo del valore atteso

L'idea è che noi abbiamo definito una relazione che vale nella popolazione (modello lineare), ma noi non conosciamo tutta la popolazione per cui abbiamo a che fare con un campione di individui. Quel campione può essere o non essere rappresentativo della popolazione, e può portarci a stime che sono più o meno vicine al valore del parametro della popolazione. Noi ragioniamo in termini di valore atteso, quindi calcoliamo il valore atteso di OLS.

Faremo delle assunzioni SLR (Simple Linear Regression) sul modello:

  1. Assunzione "Linear in Parameters" (linearità dei parametri): nella popolazione, il modello segue una funzione lineare. Quindi il modello della popolazione è: y = b0 + b1x, dove b0 e b1 sono i parametri incogniti della popolazione.
  2. Assunzione "Random Sampling": abbiamo estratto un campione casuale di dimensione n, e assumiamo che questo campione segua lo stesso modello della popolazione.
Assunzione "Sample Variation in the Explanatory Variable": deve esserci variazione nel regressore, ossia i valori di x non devono essere tutti uguali. Assunzione "Zero Conditional Mean": nella popolazione, il termine di errore ha media condizionale uguale a 0 e, quindi, il valore atteso del termine di errore, date le x, è uguale a 0 per tutti i valori di x. Come dimostriamo che l'OLS è imparziale (unbiased) rispetto a β? Dobbiamo calcolare il valore atteso di β e dimostrare che il suo valore atteso è uguale a β. Questo significa che se abbiamo a disposizione diversi campioni e calcoliamo tutte le stime β̂ derivanti da ogni campione, in media lo stimatore OLS è imparziale per il parametro della popolazione β₁. Una cosa da tener in considerazione è che i valori di x sono fissi ogni volta che ripetiamo i campioni. Quindi le x sono sempre le stesse e possiamo condizionare su x. Come si trova l'unbiased dell'OLS? Passo 1: la formula di β₁èQuesto significa:Un'altra forma di riscrivere la covarianza è la seguente:// Siccome la quantità in basso è sempre fissa, la chiameremo SSTx (Total Sum Square rispetto ax).LAVORIAMO SUL NUMERATORE:Siccome y = β0+β1x+u, andiamo a sostituire questo modello alla formula di prima:Se moltiplichiamo i termini, diventa:Il primo addendo (β0 * sommatoria(xi-x medio)) è la proprietà della media che fa 0.Il secondo addendo (tolto b1) è l'SSTx.Quindi otteniamo:Riprendendo anche il denominatore di prima, ora abbiamo:che è uguale a:Ora dobbiamo dimostrare che quello ha valore atteso uguale a 0.Definiamo una quantità wi:Sulla base di questo possiamo riscrivere b1 cappuccio nel seguente modo:Ora dobbiamo prendere il valore atteso di quest'ultima parte. Il valore atteso di b1 cappuccio èuguale a:Che si può scrivere come:Il valore atteso di b1 è b1 (il valore atteso di una costante

è la costante stessa). Il valore atteso di una somma è uguale alla somma dei valori attesi, quindi la seconda parte si può riscrivere come:

wi sarebbero tutti i termini in x, ma siccome abbiamo detto che le x sono fisse in differenti campioni, significa che le x sono costanti e le posso portare fuori dal valore atteso. Quindi quest'ultima espressione la posso scrivere come:

Ma il valore atteso di ui è uguale a 0, quindi otteniamo:

(Lo stimatore ha questa proprietà, non la stima).

LEZIONE 12.

Prime righe del file Class_2_sp su R quest'ultima cosa su R, generando dei datiVediamo random e dimostrando che se ripetiamo la generazione di una serie di coefficienti, i coefficienti stimati in media hanno quasi esattamente il valore di b0 e b1.

Riprendiamo dalla quarta assunzione fatta alla scorsa lezione.

4. Assunzione "Zero Conditional Mean": nella popolazione, il termine di errore ha media condizionale uguale a 0 e, quindi il valore atteso del

Termine di errore, date le x, è uguale a 0 per tutti i valori di x. Ci sono diversi casi in cui questa ipotesi potrebbe non essere vera, ad esempio se ci fossero dei fattori omessi dal modello, che normalmente sono importanti per spiegare y (attraverso il nesso di causalità con x), porterebbe al fallimento della quarta ipotesi e il modello OLS sarebbe parziale.

ESEMPIO di fallimento dell'ipotesi: valori OLS della performance degli studenti di una scuola superiore e dei criteri di valutazione dei professori degli studenti (=math4 da 0 a 100 che misura il risultato di un esame di matematica).

Il valore ptr è il numero degli studenti per insegnanti e ci serve perché quando la classe è piccola la performance degli studenti dovrebbe essere migliore. Sappiamo che, cioè per ogni studente in meno nella classe la percentuale di successo nel quiz math4 è di 0.64 punti percentuali. Una diminuzione della deviazione standard (intorno a 2.7) nei

ptr porta all'aumento della possibilità di passare l'esame di 0.064(2.17) = 0.17 in punti percentuali. In questo caso non si può stabilire se ci sono fattori in u correlati con la x, ma si tratta di ragionare su tutti i fattori che possono essere correlati con la x e vedere se l'esclusione di queste variabili dal modello può essere problematica per la quarta assunzione che renderebbe l'OLS biased. Però questa è una considerazione che non può essere verificata empiricamente ed è per questo che la quarta assunzione è contestabile. Abbiamo ora un modo per calcolare, attraverso le quattro proprietà, la veridicità dell'OLS. Potremmo avere necessità di una misura della dispersione nella distribuzione semplice degli estimatori: questa misura è la varianza. Finora abbiamo definito 4 proprietà e abbiamo stabilito che se sono vere, l'OLS è unbiased (imparziale). Una volta che

stabiliamo se lo stimatore è unbiased, c'è la proprietà di efficienza dello stimatore da verificare. La prossima volta vedremo che l'OLS è unbiased ed è anche efficiente.

LEZIONE 13.

Il fatto di essere unbiased non è sufficiente, perché dobbiamo avere anche una misura della dispersione nella distribuzione semplice degli stimatori, che ci viene data dalla varianza.

Se abbiamo due stimatori unbiased, tra i due se conosciamo la varianza sceglieremo quella più ridotta, poiché c'è maggiore probabilità di essere vicini al valore vero del parametro della popolazione.

Per poter calcolare la varianza dello stimatore OLS dobbiamo aggiungere una assunzione: omoschedasticità o varianza costante: in cui diciamo che la varianza dell'errore date le x è sigma al quadrato (che non conosciamo), indipendente dai valori delle x:

Da cui possiamo dire che: (il valore atteso di u al quadrato è sigma

alquadrato). Le cinque ipotesi insieme implicano che:

Discutiamo la ragionevolezza di questa ipotesi: supponiamo che y = sav (risparmio) e x = inc (reddito), dove il valore atteso del risparmio dato il reddito è una funzione lineare del reddito e ci aspettiamo che beta1 > 0. La varianza del risparmio dato il reddito è costante ed è:

Ma non è sempre così, ad esempio per persone che hanno reddito alto non possiamo dire che tutto ciò che non va in inc va in sav, dipende dalla capacità di risparmio della famiglia. Ripassando dalla prima alla quinta assunzione diremo che: (lasciamo perdere la seconda espressione)

Vediamo da dove arriva la prima espressione: questa espressione la otteniamo prendendo due formule: le w sono in funzione (dipendenti) con x.tutte Abbiamo detto che: (la varianza di una sommatoria quando le variabili sono dipendenti tra di loro è pari alla sommatoria delle varianze), dove Var(wi ui) è uguale a, quindi la

varianza di beta1 cappello diventa Var(beta1 hat) = .Dove: , quindi Var(wi ui) è uguale a , ma siccome, potremo scrivere che è uguale a e infine diremo che è ugualea .Dunque:Se cresce la varianza dell'errore anche la varianza di beta1 heat aumenta,mentre se aumenta la varianza di SSTx aumenta, la varianza di beta1 heat diminuisce (quindi se abbiamo una n grande in virtù di questo si riduce la varianza dell'OLS diun rate di 1/n)SSTx sappiamo che è la devianza di x, e:Aggiustiamo la formula per i gradi di libertà:Una volta che rimpiazziamo questo sigma quadrato cappello nella formula della varianzaotteniamo una varianza stimata di beta1 heat:Solitamente siamo abituati a calcolare anche la deviazione standard, che sarebbe:e se rimpiazziamo questa espressione con la radice quadrata della varianzastimata otteniamo lo standard error:Come facciamo a stimare la varianza dell'errore? Attraverso i residui:Una volta stimata la inseriamonell'espressione della varianza dell'OLS e possiamo calcolare il standard error. Proviamo ora a fare due esercizi:
  1. a) 98.07 e 98.07 - 0.235*20 inclinata negativamente e quindi il peso andrà a decrescere. → retta
  2. b) No, le sigarette fumate in media non hanno un nesso di casualità con il peso del bambino, perché siccome stiamo studiando un modello di regressione lineare non stiamo considerando tutti gli altri fattori che sono altrettanto importanti se non di più, e non essendo esplicitamente messi nel modello fanno sì che il nesso di causalità sia veramente difficile da stabilire con un modello come questo.
  3. c) dovrebbe essere un numero negativo, il che non è possibile perché deve essere minimo 0, quindi

LEZIONE 14.

Esercizio 1 da svolgere su R:

Esercizio 2 da svolgere su R:

Esercizio 3 da svolgere su R:

LEZIONE 15.

Modello di regressione lineare multipla

Oggi iniziamo il .

Esempio 1: fino adesso abbiamo considerato la relazione tra wage ed education, adesso consideriamo l'estensione di questo modello e includiamo nel modello una ulteriore variabile, ovvero l'IQ (=quoziente intellettivo). Il vantaggio di includere IQ è che di fatto la escludiamo dal termine di errore, dunque se IQ è una buona proxy per l'intelligenza dell'individuo, il fatto di averla inclusa del modello, crea una stima del modello dell'educazione più realistica.

Esempio 2: relazione tra perdere delle classi (=non seguire le lezioni) e il punteggio dell'esame finale. Consideriamo una variabile che tiene conto dell'abilità degli studenti, che può ess

Dettagli
A.A. 2021-2022
66 pagine
SSD Scienze economiche e statistiche SECS-P/05 Econometria

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher toniapascarella di informazioni apprese con la frequenza delle lezioni di Econometria e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli studi Gabriele D'Annunzio di Chieti e Pescara o del prof Piras Gianfranco.