Anteprima
Vedrai una selezione di 4 pagine su 11
Appunti Modelli statistici per l'impresa Pag. 1 Appunti Modelli statistici per l'impresa Pag. 2
Anteprima di 4 pagg. su 11.
Scarica il documento per vederlo tutto.
Appunti Modelli statistici per l'impresa Pag. 6
Anteprima di 4 pagg. su 11.
Scarica il documento per vederlo tutto.
Appunti Modelli statistici per l'impresa Pag. 11
1 su 11
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

CON

2. Incorrelazione con le esplicative >

-

3. Distribuzione normale

1º analisi da effettuare —> analisi grafica:

In base a come sono distribuiti i punti che rappresentano i residui, si può capire se c’è omoschedasticità o

eteroschedasticità.

Se sono distribuiti in maniera omogenea si ha omoschedasticità.

-

...

: Se gli errori si allargano alla fine vi è eteroschedasticità.

L

ini

2º Possiamo anche notare che se abbiamo omoschedasticità, il valore atteso di E = 0 per cui la media è nulla.

3º Se c’è un pattern evidente ( nuvola dei punti ), non c’è linearità.

GRAFICAMENTE VALUTO NORMALITÀ

Graficamente valutiamo la normalità e per fare ciò bisogna verificarla:

1. istogramma= forma campanulare se c’è normalità

2. QQ plot = plot dove traccio la bisettrice e se i punti si distribuiscono su di essa c’è normalità. Per capire come si

-

distribuiscono i punti nel grafico, dobbiamo avere le seguenti coordinate:

1)

• Quantili teorici di una distribuzione normale sono riportati sull’asse orizzontale.

B

• Quantili dei residui standardizzati sono riportati sull’asse verticale.

I RESIDUA SSE

DEVIANTA

I residui si dicono internamente studentizzati ( ) quando la varianza viene ottenuta come devianza

libertà

de

gradi

K

n -

residua divisa per gli n-k gdl, mentre per quelli esternamente studentizzati si fanno n stime diverse dalla varianza perché

l’analisi è volta ad individuare gli outliers ed escludere dal calcolo, le unità sotto esame.

-

Per la normalità oltre i grafici dobbiamo svolgere dei test chiamati di MISS - SPECIFICAZIONE ossia test che indagano su

tutte le ipotesi di un modello (omoschedasticità, eteroschedasticità, normalità, linearità e incorrelazione). La Miss-

specificazione accetta l’ipotesi nulla H0. Accett

Ob :

Abbiamo 3 test alternativi tra loro: Ho

1) JARQUE BERA TEST —> test asintotico (su grandi campioni).

Accetto l’ipotesi nulla perché spero ci sia normalità, quindi: PVawe) e Rho

a

p-value > alfa —> rifiuto ipotesi nulla, perché i dati non sono normalmente distribuiti. Alto

Vale

P X

- e

p- value < alfa —> accetto ipotesi nulla, perché spero ci sia normalità. :

valore ottimale

Il valore che risulta dal test va da 0 a 1, il valore ottimale è intorno allo 0.

2) SHAPIRO WIK TEST —> è un test non parametrico che viene utilizzato per piccoli campioni. È un test più flessibile ma

meno potente (tanto più potente tanto più è facile rifiutare correttamente l’ipotesi nulla).

Il risultato varia tra 0 e 1. Il valore ottimale è 1. —> Se il p value ottenuto dal test è inferiore al livello di significatività scelto

RHo

(comunemente 0.5), allora si rigetta l'ipotesi nulla, indicando che i dati non seguono una distribuzione normale.

D

O

3) KOLMOGOROV SMIRNOFF —> confronto tra la mia distribuzione dei residui e una normale e se i punti si

-

distribuiscono ugualmente, c’è normalità.

-

-

Se non c’è ancora normalità nonostante i test facciamo 3 cose: D

1) Trasformazione della Y —> con il metodo Box Cox stima un valore ossia e ci dice la trasformazione adatta

yt

indicandola con .

La trasformazione migliore può essere: i) radice ii) logaritmica iii) inversa ovvero reciproco

2) Se non dovessimo riuscire a trasformare la Y, dobbiamo agire sui punti di influenza ovvero quei punti che hanno

Cook

distanza di

Distanza di Cook —> serve per capire quanta informazione si perde eliminando dall’insieme dei dati un particolare dato.

I punti di influenza possono essere:

• outliers ovvero Y anomala

• Punti di alta leverage ovvero X anomalo

alta

punti de

--

= >

: :

4 everage nomala

X

-

authers :.:::

Per agire su questi punti di influenza, utilizzo il test di Bonferroni che identifica gli outliers e li esclude, che ripete uno dei

3 test alternativi per vedere se è normale, se non è ancora normale tolgo anche i punti di alta leverage e faccio di nuovo

uno dei 3 test di normalità e se ancora non c’è passo al terzo passaggio.

3) Trasformazione esplicativa (x): andiamo a verificare graficamente che queste trasformazioni interagiscono con una

dipendente Y osservando lo scatter plot e verificando la distribuzione dei punti.

• Se questi si distribuiscono lungo una curva che si appiattisce con un basso tasso, allora è meglio trasformare con log o

radice.

• Se la curva non si appiattisce è meglio utilizzare gli esponenziali grande

molto

campioni

-T

-

4) Se ancora non è normale si usa il teorema dei limiti centrali —> se n tende a + .

2

Test di omoschedasticità

Il test di omoschedasticità viene utilizzato per verificare se la varianza degli errori in un modello di regressione è costante

per tutti i livelli delle X. L'omoschedasticità garantisce la validità delle inferenze statistiche. Quando questa assunzione non

è rispettata, si parla di eteroschedasticità, che può portare a stime inefficienti e test di ipotesi fuorvianti.

Test di Breusch-Pagan

Uno dei test più comuni per verificare l'omoschedasticità è il test di Breusch-Pagan. Il test di Breusch-Pagan rileva

l'eteroschedasticità in un modello di regressione.

Procedura del Test

1. Stimare il Modello di Regressione: yi=β0+β1 xi1+β2 xi2+…+βk xik+ εi

2. Calcolare i Residui: si calcolano i residui ε ^i dal modello di regressione. Solo

3. Calcolare la Regressione Ausiliaria: facciamo una regressione sul quadrato dei residui ε^i2 sulle variabili esplicative

o su una loro funzione: ε ^i2 =γ0 +γ1 xi1 +γ2 xi2 +…+γk xik +vi faccio

>

- resiDo

reg Sul

la

4. Calcolare la Statistica del Test: la statistica del test di Breusch-Pagan è basata sulla seguente formula:

STATISTICA

È La LM=n per R^2 dove n è il numero di osservazioni e R^2 è il coefficiente di determinazione ottenuto dalla regressione

-

TEST ausiliaria.

5. Confrontare la statistica del test con il valore critico χ2 (α=0.05) della distribuzione:

• Se LM > α, si rifiuta l'ipotesi nulla c’è eteroschedasticità

• Se LM < o = α, accetta l'ipotesi nulla perché c’è omoschedasticità.

Accetto l’ipotesi nulla come nella miss-specificazione.

Test di White

Un altro test comunemente usato è il test di White.

Procedura del Test

1. Stimare il Modello di Regressione: si stima il modello di regressione lineare: yi =β0 +β1 xi1 +β2 xi2 +…+βk xik + εi

2. Calcolare i Residui: si calcolano i residui ε^i .

...

3. Calcolare la Regressione Ausiliaria: anche qui si regredisce il quadrato dei residui ε^i2 su tutte le X, le loro quadrati e i

loro prodotti incrociati: ε^i2 =γ0 +γ1 xi1 +γ2 xi2 +…+γk xik +γk+1 xi12 +γk+2 xi22 +…+γk(k+1)/2 (xi1 )+vi

⋅xi2

4. Calcolare la Statistica del Test: la statistica del test di White è data da: LM=nR2 dove R2 è il coefficiente di

determinazione della regressione ausiliaria.

5. Determinare il Valore Critico: χ2 con m gradi di libertà (dove m è il numero di regressori nella regressione ausiliaria,

inclusi i termini quadratici e incrociati).

6. Confrontare la statistica LM con il valore critico della distribuzione χ2.

• Se LM > χ2, si rifiuta l'ipotesi nulla significa che c'è evidenza di eteroschedasticità.

• Se la statistica LM < o = χ2, accetto l'ipotesi nulla significa che non ci sono prove sufficienti per affermare che la

varianza degli errori non è costante.

Mi serve per risolvere i problemi di eteroschedasticità, ossia se dovesse essere i vado ad irrobustire

gli stimatori OLS per far in modo che l’errore standard non sia influenzato dall’ esteroschedastcità

Correzione di White

Oltre al test di eteroschedasticità, White ha proposto una correzione per la matrice di covarianza degli stimatori di

regressione, che rende i risultati robusti all'eteroschedasticità. Questa correzione consente di ottenere errori standard

corretti che non sono influenzati dall'eteroschedasticità.

Confronto tra i Due Test

1. Il test di Breusch-Pagan utilizza una specifica forma funzionale lineare per testare l'eteroschedasticità. Il test di White è

più generale e non fa assunzioni sulla forma funzionale della varianza degli errori.

2. Regressione Ausiliaria: Il test di Breusch-Pagan regredisce il quadrato dei residui sulle X. Il test di White include anche

i termini quadratici e incrociati delle variabili X.

3. Uso della Statistica del Test: Entrambi i test utilizzano una statistica LM basata sul R2 della regressione ausiliaria e

seguono una distribuzione χ2.

Sia il test di Breusch-Pagan che il test di White sono utilizzati per rilevare l'eteroschedasticità in un modello di regressione.

Sebbene abbiano obiettivi simili, il test di White è più generale e robusto rispetto al test di Breusch-Pagan, il che lo rende

più flessibile per varie forme di eteroschedasticità. La correzione di White, inoltre, fornisce un metodo per ottenere errori

standard corretti che sono robusti all'eteroschedasticità.

Test di Mal-Specificazione —> Test RESET

Il Test RESET di Ramsey è un utile strumento per rilevare errori di specificazione del modello di regressione. Identificando

problemi come l'omissione di variabili rilevanti, la forma funzionale errata o le interazioni mancanti, il test RESET aiuta a

migliorare la qualità e l'affidabilità delle inferenze statistiche derivate dal modello.

• Ipotesi Nulla (H0): Il modello è correttamente specificato.

• Ipotesi Alternativa (H1): Il modello non è correttamente specificato.

• Se la statistica F > α, si rifiuta l'ipotesi nulla, indicando che il modello potrebbe essere mal specificato.

• Se la statistica F < o = α, accetta l'ipotesi nulla, suggerendo che il modello non è mal specificato.

VIF —> variance inflation factor

Si può utilizzare quando riscontriamo un problema di PERFETTA COLLINEARITÀ che è rara, infatti il VIF si usa di più con

la MULTICOLLINEARITÀ.

Dettagli
A.A. 2024-2025
11 pagine
SSD Scienze economiche e statistiche SECS-S/01 Statistica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher marcofavaron01 di informazioni apprese con la frequenza delle lezioni di Modelli statistici per l'impresa e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Roma La Sapienza o del prof Guagnano Giuseppina.