vuoi
o PayPal
tutte le volte che vuoi
CON
2. Incorrelazione con le esplicative >
-
3. Distribuzione normale
1º analisi da effettuare —> analisi grafica:
In base a come sono distribuiti i punti che rappresentano i residui, si può capire se c’è omoschedasticità o
eteroschedasticità.
Se sono distribuiti in maniera omogenea si ha omoschedasticità.
-
...
: Se gli errori si allargano alla fine vi è eteroschedasticità.
L
ini
2º Possiamo anche notare che se abbiamo omoschedasticità, il valore atteso di E = 0 per cui la media è nulla.
3º Se c’è un pattern evidente ( nuvola dei punti ), non c’è linearità.
GRAFICAMENTE VALUTO NORMALITÀ
Graficamente valutiamo la normalità e per fare ciò bisogna verificarla:
1. istogramma= forma campanulare se c’è normalità
2. QQ plot = plot dove traccio la bisettrice e se i punti si distribuiscono su di essa c’è normalità. Per capire come si
-
⑳
distribuiscono i punti nel grafico, dobbiamo avere le seguenti coordinate:
1)
• Quantili teorici di una distribuzione normale sono riportati sull’asse orizzontale.
B
• Quantili dei residui standardizzati sono riportati sull’asse verticale.
I RESIDUA SSE
DEVIANTA
I residui si dicono internamente studentizzati ( ) quando la varianza viene ottenuta come devianza
libertà
de
gradi
K
n -
residua divisa per gli n-k gdl, mentre per quelli esternamente studentizzati si fanno n stime diverse dalla varianza perché
l’analisi è volta ad individuare gli outliers ed escludere dal calcolo, le unità sotto esame.
-
Per la normalità oltre i grafici dobbiamo svolgere dei test chiamati di MISS - SPECIFICAZIONE ossia test che indagano su
tutte le ipotesi di un modello (omoschedasticità, eteroschedasticità, normalità, linearità e incorrelazione). La Miss-
specificazione accetta l’ipotesi nulla H0. Accett
Ob :
Abbiamo 3 test alternativi tra loro: Ho
1) JARQUE BERA TEST —> test asintotico (su grandi campioni).
Accetto l’ipotesi nulla perché spero ci sia normalità, quindi: PVawe) e Rho
a
p-value > alfa —> rifiuto ipotesi nulla, perché i dati non sono normalmente distribuiti. Alto
Vale
P X
- e
p- value < alfa —> accetto ipotesi nulla, perché spero ci sia normalità. :
valore ottimale
Il valore che risulta dal test va da 0 a 1, il valore ottimale è intorno allo 0.
2) SHAPIRO WIK TEST —> è un test non parametrico che viene utilizzato per piccoli campioni. È un test più flessibile ma
meno potente (tanto più potente tanto più è facile rifiutare correttamente l’ipotesi nulla).
Il risultato varia tra 0 e 1. Il valore ottimale è 1. —> Se il p value ottenuto dal test è inferiore al livello di significatività scelto
RHo
(comunemente 0.5), allora si rigetta l'ipotesi nulla, indicando che i dati non seguono una distribuzione normale.
D
O
3) KOLMOGOROV SMIRNOFF —> confronto tra la mia distribuzione dei residui e una normale e se i punti si
-
distribuiscono ugualmente, c’è normalità.
-
-
Se non c’è ancora normalità nonostante i test facciamo 3 cose: D
1) Trasformazione della Y —> con il metodo Box Cox stima un valore ossia e ci dice la trasformazione adatta
yt
indicandola con .
La trasformazione migliore può essere: i) radice ii) logaritmica iii) inversa ovvero reciproco
2) Se non dovessimo riuscire a trasformare la Y, dobbiamo agire sui punti di influenza ovvero quei punti che hanno
Cook
distanza di
Distanza di Cook —> serve per capire quanta informazione si perde eliminando dall’insieme dei dati un particolare dato.
I punti di influenza possono essere:
• outliers ovvero Y anomala
• Punti di alta leverage ovvero X anomalo
alta
punti de
--
= >
: :
4 everage nomala
X
-
authers :.:::
Per agire su questi punti di influenza, utilizzo il test di Bonferroni che identifica gli outliers e li esclude, che ripete uno dei
3 test alternativi per vedere se è normale, se non è ancora normale tolgo anche i punti di alta leverage e faccio di nuovo
uno dei 3 test di normalità e se ancora non c’è passo al terzo passaggio.
3) Trasformazione esplicativa (x): andiamo a verificare graficamente che queste trasformazioni interagiscono con una
dipendente Y osservando lo scatter plot e verificando la distribuzione dei punti.
• Se questi si distribuiscono lungo una curva che si appiattisce con un basso tasso, allora è meglio trasformare con log o
radice.
• Se la curva non si appiattisce è meglio utilizzare gli esponenziali grande
molto
campioni
-T
-
4) Se ancora non è normale si usa il teorema dei limiti centrali —> se n tende a + .
2
Test di omoschedasticità
Il test di omoschedasticità viene utilizzato per verificare se la varianza degli errori in un modello di regressione è costante
per tutti i livelli delle X. L'omoschedasticità garantisce la validità delle inferenze statistiche. Quando questa assunzione non
è rispettata, si parla di eteroschedasticità, che può portare a stime inefficienti e test di ipotesi fuorvianti.
Test di Breusch-Pagan
Uno dei test più comuni per verificare l'omoschedasticità è il test di Breusch-Pagan. Il test di Breusch-Pagan rileva
l'eteroschedasticità in un modello di regressione.
Procedura del Test
1. Stimare il Modello di Regressione: yi=β0+β1 xi1+β2 xi2+…+βk xik+ εi
2. Calcolare i Residui: si calcolano i residui ε ^i dal modello di regressione. Solo
3. Calcolare la Regressione Ausiliaria: facciamo una regressione sul quadrato dei residui ε^i2 sulle variabili esplicative
o su una loro funzione: ε ^i2 =γ0 +γ1 xi1 +γ2 xi2 +…+γk xik +vi faccio
>
- resiDo
reg Sul
la
4. Calcolare la Statistica del Test: la statistica del test di Breusch-Pagan è basata sulla seguente formula:
STATISTICA
È La LM=n per R^2 dove n è il numero di osservazioni e R^2 è il coefficiente di determinazione ottenuto dalla regressione
-
TEST ausiliaria.
5. Confrontare la statistica del test con il valore critico χ2 (α=0.05) della distribuzione:
• Se LM > α, si rifiuta l'ipotesi nulla c’è eteroschedasticità
• Se LM < o = α, accetta l'ipotesi nulla perché c’è omoschedasticità.
Accetto l’ipotesi nulla come nella miss-specificazione.
Test di White
Un altro test comunemente usato è il test di White.
Procedura del Test
1. Stimare il Modello di Regressione: si stima il modello di regressione lineare: yi =β0 +β1 xi1 +β2 xi2 +…+βk xik + εi
2. Calcolare i Residui: si calcolano i residui ε^i .
...
3. Calcolare la Regressione Ausiliaria: anche qui si regredisce il quadrato dei residui ε^i2 su tutte le X, le loro quadrati e i
loro prodotti incrociati: ε^i2 =γ0 +γ1 xi1 +γ2 xi2 +…+γk xik +γk+1 xi12 +γk+2 xi22 +…+γk(k+1)/2 (xi1 )+vi
⋅xi2
4. Calcolare la Statistica del Test: la statistica del test di White è data da: LM=nR2 dove R2 è il coefficiente di
determinazione della regressione ausiliaria.
5. Determinare il Valore Critico: χ2 con m gradi di libertà (dove m è il numero di regressori nella regressione ausiliaria,
inclusi i termini quadratici e incrociati).
6. Confrontare la statistica LM con il valore critico della distribuzione χ2.
• Se LM > χ2, si rifiuta l'ipotesi nulla significa che c'è evidenza di eteroschedasticità.
• Se la statistica LM < o = χ2, accetto l'ipotesi nulla significa che non ci sono prove sufficienti per affermare che la
varianza degli errori non è costante.
Mi serve per risolvere i problemi di eteroschedasticità, ossia se dovesse essere i vado ad irrobustire
gli stimatori OLS per far in modo che l’errore standard non sia influenzato dall’ esteroschedastcità
Correzione di White
Oltre al test di eteroschedasticità, White ha proposto una correzione per la matrice di covarianza degli stimatori di
regressione, che rende i risultati robusti all'eteroschedasticità. Questa correzione consente di ottenere errori standard
corretti che non sono influenzati dall'eteroschedasticità.
Confronto tra i Due Test
1. Il test di Breusch-Pagan utilizza una specifica forma funzionale lineare per testare l'eteroschedasticità. Il test di White è
più generale e non fa assunzioni sulla forma funzionale della varianza degli errori.
2. Regressione Ausiliaria: Il test di Breusch-Pagan regredisce il quadrato dei residui sulle X. Il test di White include anche
i termini quadratici e incrociati delle variabili X.
3. Uso della Statistica del Test: Entrambi i test utilizzano una statistica LM basata sul R2 della regressione ausiliaria e
seguono una distribuzione χ2.
Sia il test di Breusch-Pagan che il test di White sono utilizzati per rilevare l'eteroschedasticità in un modello di regressione.
Sebbene abbiano obiettivi simili, il test di White è più generale e robusto rispetto al test di Breusch-Pagan, il che lo rende
più flessibile per varie forme di eteroschedasticità. La correzione di White, inoltre, fornisce un metodo per ottenere errori
standard corretti che sono robusti all'eteroschedasticità.
Test di Mal-Specificazione —> Test RESET
Il Test RESET di Ramsey è un utile strumento per rilevare errori di specificazione del modello di regressione. Identificando
problemi come l'omissione di variabili rilevanti, la forma funzionale errata o le interazioni mancanti, il test RESET aiuta a
migliorare la qualità e l'affidabilità delle inferenze statistiche derivate dal modello.
• Ipotesi Nulla (H0): Il modello è correttamente specificato.
• Ipotesi Alternativa (H1): Il modello non è correttamente specificato.
• Se la statistica F > α, si rifiuta l'ipotesi nulla, indicando che il modello potrebbe essere mal specificato.
• Se la statistica F < o = α, accetta l'ipotesi nulla, suggerendo che il modello non è mal specificato.
VIF —> variance inflation factor
Si può utilizzare quando riscontriamo un problema di PERFETTA COLLINEARITÀ che è rara, infatti il VIF si usa di più con
la MULTICOLLINEARITÀ.