DOMANDE:
→Cosa vuol dire che a ritardo 12 l’autocorrelazione assume valore 0,75? Vuol dire che un certo mese con lo
stesso mese dell’anno precedente ma anche con lo stesso mese dell’anno successivo l’autocorrelazione è del
75%.
→Cosa vuol dire che a ritardo 24 l’autocorrelazione assume valore 0,62? Vuol dire che un certo mese ha una
autocorrelazione di 0,62 con lo stesso mese di due anni prima e di due anni dopo…etc
→Cosa vuol dire che a ritardo 6 l’autocorrelazione assume valore -0,30? Vuol dire che un certo mese con il
sesto mese precedente ha un’autocorrelazione negativa di -0,30 e con lo stesso mese di 6 mesi dopo.
ATTENZIONE!! Questa interpretazione è generale ovvero non è inteso solo per un mese, come gennaio del
2022 è correlato o meno con gennaio del 2021, ovvero si interpreta che qualunque mese, perché posso dire
che il 75% di correlazione ce l’ho su gennaio 2022 con gennaio 2021 ma ce l’ho anche su febbraio 2022 e su
febbraio 2021...etc
Correlogramma parziale (PACF)
Lo stesso ragionamento si ripete sul correlogramma parziale, ovvero l’autocorrelazione al netto/ripulita da
tutti i ritardi intermedi.
→Grafico White Noise: (solo a ritardo 62 è fuori dalla banda di confidenza ma è casualità!) quindi a qualunque
ritardo l’autocorrelazione non è significativa pur tenendo conto dei ritardi intermedi.
pag. 50
→Grafico Random Walk: la versione dell’ACF parziale è completamente zero tranne per il primo ritardo,
questo ci dice che data la mia serie storica l’unico ritardo che conta nel determinare gli altri è il precedente
ovvero a ritardo 1. Quindi dalla pulizia dei ritardi intermedi l’unico che sopravvive è a ritardo 1 ovvero l’unico
che determina l’andamento della serie storica! L’autocorrelazione parziale è 1 o prossima ad 1 a ritardo 1 e
questo vuol dire che il valore di oggi è spiaccicato al valore di ieri per una leggera variazione casuale che è
esattamente la definizione di random walk. Quindi quando osservo un PACF così vuol dire che tutta l’ACF che
ho osservato nel grafico precedente in realtà la riconduco a questa situazione Y = Y +ε ovvero la definizione
t t-1 t
di random walk. Perché una volta depurato dai ritardi intermedi lui è l’unico che rimane e rimane con un
effetto che è prossimo al 100%!
→Dati reali-concentrazione giornaliere di NO2 a Milano Lambrate: (stagionali ma molto rumorose) anche
qui il primo ritardo è l’unico che sopravvive, gli altri bene o male vengono azzerati tutti perché hanno dei
valori molto bassi. Quindi vuol dire che qui c’è una forte persistenza nonostante io abbia eliminato gli effetti
intermedi. Ha un effetto significativo solo il primo ritardo, gli altri ritardi non generano un effetto significativo
e se ce l’hanno sono nascosti dal rumore.
→Dati reali-vendita di gasolio agricolo in Italia: conferma la teoria della stagionalità che si vedeva ad occhio
perché gli unici due ritardi parziali un po' più significativi degli altri sono il ritardo 1 e il ritardo 12, il ritardo 12
è proprio sintomo della stagionalità perché ogni 12 ritardi ho una correlazione talmente forte che pur
depurandola dagli effetti intermedi rimane questa autocorrelazione. Si ha anche il ritardo 1 significa che oltre
al 12 come ritardo rilevante c’è anche il ritardo 1, quindi la serie storica probabilmente sarà generata da un
processo che è stagionale ma ha anche una componente di ritardo a brevissimo termine quindi un mese
sull’altro. Il ritardo 1 indica il fatto che il passaggio da un mese all’altro è un passaggio abbastanza liscio.
In entrambi i grafici di ACF e PACF ci sono le bande di confidenza che corrispondono al Test di Bartlett per
l’assenza di autocorrelazione, cioè, posso costruire intervalli di confidenza che non dipendono dai ritardi
perché sono costanti per qualunque ritardo K (limite del Test di Bartlett).
Test di Bartlett
La seguente statistica test dell’intervallo di confidenza va a testare se una singola autocorrelazione a ritardo
K sia nulla (gli intervalli di confidenza non dipendono dai ritardi). Quindi per testare se una singola
autocorrelazione è statisticamente significativa (non nulla), si osserva se la singola funzione di
autocorrelazione si annulla dopo un certo ritardo (lag), cioè se ρ = 0 per k>m. Il test asintotico di Bartlett
k
utilizza come valori critici:
e come statistica test il valore dell’autocorrelazione campionaria ρ . Una generica autocorrelazione è
k
considerata nulla se il valore stimato esce dall’intervallo di confidenza. Graficamente, l’intervallo di confidenza
è rappresentato dalle rette orizzontali nelle ACF e PACF, più il campione è grande e più le bande si stringono
verso lo zero.
Limite: il fatto che gli intervalli di confidenza non dipendono dai ritardi non è il massimo perché i ritardi non
sono “uguali” fra di loro. Allora sono state sviluppate delle tipologie diverse del Test di Bartlett un po' più
sofisticate che sono i Test di Portmanteau.
pag. 51
Test Portmanteau: Box and Pierce (1970) e Ljung and Box (1978, 1979)
Questo test l’hanno creato perché a loro non andava bene che il ritardo fosse ininfluente nello stabilire se
una certa autocorrelazione fosse significativa o meno e quindi sviluppano questi due test.
Oltre alla verifica di ipotesi sui singoli coefficienti di autocorrelazione è possibile utilizzare un particolare test,
chiamato Portmanteau, che è stato proposto in due versioni: la prima dovuta a Box and Pierce (1970) e la
→
seconda a Ljung and Box (1978, 1979) si differenziano in base ai pesi che danno!
Entrambi i test verificano le ipotesi congiunte:
Ipotesi nulla: le prime K autocorrelazioni sono nulle ovvero il processo nei primi K ritardi è un White Noise;
Ipotesi alternativa: afferma che almeno un coefficiente di autocorrelazione all’interno dei k coeff. di
autocorrelazione risulta significativamente diverso da zero, e quindi conduca al rifiuto dell’ipotesi che la serie
sia la realizzazione di un processo White Noise.
L’idea è che si esegue il test un tot di volte fissando un K diverso ogni volta e a mano a mano che vado avanti
i rigetti dell’ipotesi diventano sempre di meno. In generale questi due test vengono chiamati test di
Portmanteau perché sono casi particolari della statistica Q.
La statistica test Q del test Portmanteau e la seguente:
h=sono i gradi di libertà che si utilizzano in un contesto regressivo ovvero
dove stimo un certo numero di parametri.
dove k è il ritardo massimo da testare, n è il numero totale di osservazioni, h è il numero di gradi di libertà
(scelti a seconda della serie storica) e w sono i pesi associati ad ogni autocorrelazione. Questo test prende le
i
autocorrelazioni le eleva al quadrato, le pesa fa la somma che viene moltiplicata per n; quindi, in sostanza
crea una combinazione lineare delle prime K autocorrelazioni al quadrato.
Interpretazione del test di Portmanteau: presi tutti insieme, ovvero in blocco, i primi k valori di
autocorrelazioni sono o non sono statisticamente significativi (anche se individualmente assumono valori
bassi), ovvero le prime k mi portano ad un’autocorrelazione forte oppure no? Sotto l’ipotesi nulla c’è che le
autocorrelazioni siano deboli e quindi l’autocorrelazione complessiva sia nulla (se ognuna delle
autocorrelazioni stimate è prossima a 0, allora la statistica test sarà piccola), contro l’ipotesi alternativa che ci
sia almeno un’autocorrelazione forte che stacca dalla situazione di White Noise. Nel caso in cui il test non
fosse rigettato, la serie sarebbe indistinguibile da un processo white noise, ovvero la serie rappresenterà un
processo white noise.
A prescindere che scelgo Box and Pierce o la seconda a Ljung and Box, è importante scegliere il valore di K
ovvero il ritardo. Un approccio è testare tutti i K che voglio dandogli un senso quindi per K crescente; in ogni
caso si osserva che il ritardo k influisce sulla qualità del test. Quindi è bene utilizzare una delle tre tecniche
proposte per la scelta dei ritardi:
• Per serie non stagionali il numero di ritardi k = 10; per serie stagionali il numero di ritardi è k = 2m, dove m
è la periodicità della serie storiche ad esempio se ho i dati mensili su base annuale m sarà uguale a 12 quindi
il ritardo è 24 (Hyndman and Athanasopoulos, 2018);
• Asintoticità del test: Per serie storiche lunghe k ≈ ln(n) (Tsay, 2005);
• Affinché il test sia attendibile, si usi al massimo un ritardo pari a k = n/5 (Hyndman and Athanasopoulos,
max
2018).
pag. 52
Problema dei gradi di libertà:
n rappresenta il numero totale di osservazioni nel campione, mentre h rappresenta il numero di gradi di
libertà (correzione) del test d’ipotesi. I gradi di libertà corrispondono al numero di parametri stimati del
modello di regressione che ha generato la serie storica.
• Se il test Portmanteau è applicato alla serie storica originale (dati grezzi), allora gradi di libertà h = 0 in
quanto non ho stimato alcun parametro per ottenere la serie storica in oggetto;
• Se il test Portmanteau è applicato alla serie storica dei residui di un modello di regressione, allora gradi di
libertà h = K + 1 corrisponde al numero di parametri stimati nel modello usato per ottenere la serie storica.
Test di Box and Pierce (1970)
(peso costante: uguale per tutti ed è unitario, quindi diventa una statistica non pesata. Quindi stiamo dicendo
implicitamente che il ritardo 8 ha lo stesso peso del ritardo 2 nonostante la distanza inizia a crescere).
∀i
Se ad ogni correlazione viene associato un peso costante pari a 1, i.e. w = 1 = 1, . . . , k, la statistica Q viene
i
chiamata statistica Q di Box and Pierce (1970), che diventa:
Test di Ljung and Box (1978, 1979)
(peso dinamico: pari al numero di osservazioni + 2 / numero di osservazioni – il ritardo i-esimo che sto
considerando).
Se ad ogni correlazione viene associato un peso che dipende dal numero di osservazioni e dai ritardi, i.e.
∀i
w = (n + 2) / (n – i) = 1, . . . , k, la statistica Q viene chiamata statistica Q di Ljung and Box (1978), che diventa:
i
Le statistiche Q e Q sono asintoticamente equivalenti quando il campione è grande.
BP LB
La differenza tra il Test di Bartlett e il Test di Portmanteau è che il Q e Q tengono conto del fatto che
BP LB
l’autocorrelzione si muova, sia dinamica e quindi ne devo tenere conto nel momento in cui testo la non
autocorrelazi
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.