Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
Spiegazione del termine SER
SER:
- è espresso nella stessa unità di misura di u e quindi di Y
- misura la dispersione della distribuzione di u
- misura la "dimensione" media del residuo OLS (l'errore "medio" della retta di regressione)
Esempio: R2 e SER
La pendenza è statisticamente ed economicamente significativa anche se STR spiega solo una piccola frazione della variabilità osservata nei risultati del test.
2R basso dice che c'è un'alta percentuale della variabilità del test che non è spiegata dal rapporto STR.
Una nota pratica: Eteroschedasticità, omoschedasticità, e la formula per gli errori standard di
4 4b be0 1
Cosa indicano questi due termini?
Se var(u|X=x) è costante, cioè se la varianza della distribuzione condizionata di u dato X non dipende da X, allora si dice che u è omoschedastico. Altrimenti, si dice che u è eteroschedastico.
Omoschedasticità in figura:
19• E(u|X=x) = 0
• La varianza di u non dipende da X ed è costante
Eteroschedasticità in figura:
• E(u|X=x) = 0
• La varianza di u dipende da X
Fino a questo punto abbiamo implicitamente assunto che i termini di errore siano eteroschedastici:
Eteroschedasticità e omoschedasticità riguardano var(u|X=x). Dal momento che non abbiamo esplicitamente assunto errori omoschedastici, abbiamo implicitamente consentito che possano essere eteroschedastici.
Quali sono le conseguenze dell'omoschedasticità?
• Si può provare (Teorema di Gauss-Markov) che lo stimatore OLS è lo stimatore a varianza minima nella classe degli stimatori non distorti che sono funzione lineare di (Y ,...,Y );
La formula per la varianza di e per il corrispondente errore standard si semplificano. Se var(u |X =x) = σ^2, allora:
σ^2 u = σ^2
Formula generale per l'errore standard di σ^2 è la radice quadrata di:
1/n * Σ(u_i - u_barra)^2
Caso speciale con omoschedasticità:
standard calcolati con questa formula sono corretti sia in presenza di omoschedasticità che di eteroschedasticità.standard così calcolati sono detti errori standard robusti all'eteroschedasticità (o errori standard di White). (esempio beta pag.93)
ESERCIZI (CAP 4-5)
Regressione lineare con regressori multipli -2,28 è una stima credibile dell'effetto di una variazione del rapporto studenti/docenti sul risultato del test?
Non proprio: esiste infatti la possibilità che vi siano altri fattori, noti come "variabili omesse" (reddito delle famiglie, % di studenti non di madrelingua inglese, ecc.), che potrebbero rendere "distorto" lo stimatore OLS.
La distorsione da variabile omessa
La distorsione dello stimatore OLS causata dall'omissione di un fattore è nota come "distorsione da variabile omessa". Affinché si verifichi, il fattore omesso "Z" deve essere:
- una determinante di Y; e
- correlato con il regressore X.
Entrambe le condizioni devono essere vere affinché l'omissione di Z renda distorto.
lo stimatore OLS di β. Nel nostro esempio: 1. È plausibile che la conoscenza della lingua inglese (l'inglese è la prima o la seconda lingua?) influenzi il risultato del test. 2. Le comunità di immigranti tendono ad essere meno ricche, quindi ad avere un budget scolastico inferiore e quindi un maggiore STR; Z è correlato con X. 4b Consequentemente, è distorto. 13 casi possibili quando c'è la variabile omessa: 4b • bE(β) =1 14b • bE(β) > SOVRASTIMA1 14b • bE(β) < SOTTOSTIMA1 1 214b Se cov(X ,u ) = 0 allora è uno stimatore corretto di β. i i 1 1 Se il fattore omesso Z è: (1) una determinante di Y (e quindi è contenuto in u); e (2) correlato con X, 4br allora 0 e lo stimatore OLS è distorto. Xu 1 La formula razionalizza l'idea che i distretti con più studenti di non madrelingua inglese (1) hanno risultati peggiori al test e (2) hanno classi più grandi. Ciò determina unadistorsione negativa dello stimatore. L'esempio dei punteggi nei test mostra che, se una variabile omessa soddisfa le due condizioni della distorsione da variabili omesse, allora lo stimatore OLS nella regressione che omette tale variabile è distorto e inconsistente. Perciò, anche se n è grande, non sarà vicino a β. Ciò fa sorgere una domanda più profonda: come definiamo β? Ovvero, che cosa vogliamo stimare, precisamente, quando eseguiamo una regressione? Esistono (almeno) tre possibili risposte: 1. Vogliamo stimare la pendenza di una retta attraverso un diagramma a nuvola come semplice riassunto dei dati a cui non associamo un significato sostanziale. 2. Vogliamo effettuare previsioni del valore di Y per una unità che non appartiene all'insieme dei dati, per cui conosciamo il valore di X. 3. Vogliamo stimare l'effetto causale su Y di una variazione in X. ComePer risolvere il problema della distorsione da variabile omessa, possiamo utilizzare una metodologia che ci permetta di includere nel modello di regressione la variabile omessa, nel nostro caso la percentuale di studenti non madrelingua. Possiamo rappresentare il modello di regressione multiplo della popolazione utilizzando i seguenti tag HTML:- X, X: le due variabili indipendenti (regressori)
- (Y, X1, X2): indica l'i-esima osservazione per Y, X1 e X2
- b0: intercetta
- b1: effetto su Y di una variazione in X1, X2 costante
- b2: effetto su Y di una variazione in X2, X1 costante
- u: "termine d'errore" (ulteriori fattori omessi)


- La distribuzione condizionata di u date le X ha media nulla, cioè E(u|X1=x1,...,Xk=xk) = 0.
- La varianza di u è costante per ogni combinazione di X1, X2, ..., Xk.
- u è incorrelato con X1, X2, ..., Xk.
- (X1,...,Xn,Y), i=1,...,n, sono i.i.d.1
- E(Xi)<∞,..., E(Xi) < E(u) <1 ki4
- Collinearità non perfetta.
- Assunzione 1: La media condizionata di u date le X è zero.
- Stessa interpretazione del modello di regressione con un solo regressore.
- Se una variabile omessa (1) è rilevante per il fenomeno che analizziamo (e quindi è in u) e (2) è correlata con una variabile inclusa in X, allora questa assunzione non è vera. Se l’assunzione è violata allora lo stimatore è distorto a causa dell’omissione di variabili. La soluzione – se fattibile – è di includere la variabile omessa nella regressione.
- Assunzione 2: (X1,...,Xn,Y), i=1,...,n, sono i.i.d.1 ki
- Questa condizione è soddisfatta se i dati sono raccolti attraverso un campionamento casuale.
- Assunzione 3: quattro momenti finiti
- Questa assunzione tecnica è soddisfatta se
Le variabili hanno un dominio finito.
Assunzione 4: Collinearità non perfetta
Si ha collinearità perfetta se uno dei regressori è una funzione lineare esatta degli altri.
La distribuzione degli stimatori OLS
Date le quattro assunzioni dei minimi quadrati, 23
Verifica di ipotesi congiunte
L'ipotesi nulla che le "risorse scolastiche non contino," e l'ipotesi alternativa che invece "contino" possono essere formalizzate come
H₀: β₁ = 0 e β₂ = 0 vs. H₁: β₁ ≠ 0 o β₂ ≠ 0
Un'ipotesi congiunta è un'ipotesi che impone due o più restrizioni sui coefficienti di regressione.
Il "buon senso" ci suggerisce di rifiutare l'ipotesi nulla se almeno una delle statistiche t è maggiore di 1,96 in valore assoluto. Qualche volta però, e questo è il caso, il buon senso sbaglia.
Calcoliamo la probabilità di rifiutare l'ipotesi nulla quando questa è vera
(livello di significatività) utilizzando l'approccio basato sul "buon senso", cioè su due statistiche t individuali.
Per semplificare i calcoli supponiamo che e siano indipendentemente distribuiti.
Siano t e t le due statistiche t1 2
Il test basato sul "buon senso" è:
Qual è la probabilità di rifiutare la nulla quando la nulla è vera (dovrebbe essere il 5%)?
La dimensione ("size") di un test è il tasso di rifiuto effettivo sotto l'ipotesi nulla
- La dimensione del test basato sul "senso comune" non è il 5%
- Inoltre, la dimensione del test dipende dalla correlazione tra t e t (e quindi dalla correlazione tra1 28 4b be ).1 2 24
Due possibili soluzioni:
- Usare differenti valori critici - non 1,96 (Metodo Bonferroni)
- Usare una differente statistica del test: la statistica F
La statistica F consente di sottoporre a test una
molteplicità di ipotesi simultaneamente.
Formula per il caso particolare = e = in una regressione con due regressori1 1,0 2 2,0
Si rifiuta l’ipotesi nulla quando la statistica F è “grande”.
- La statistica F è grande quando t e/o t è grande1 2
- La statistica F corregge “nel modo giusto” per la correlazione tra t e t .1 2
- La formula in presenza di più di due regressori è molto complicata (ci serve l’algebra delle