Appunti corso Introduzione alla serie storiche

Name: Appunti corso Introduzione alla serie storiche
Brand: Skuola.net
Availability: InStock
Author: aurora.musitelli.am56

Revisionato il 15/12/2025

di aurora.musitelli.am56

Publisher

Vota

Contenuto verificato e approvato dal Team di Esperti di Skuola.net

Appunti corso Introduzione alla serie storiche anno 2023/2024 del corso di laurea magistrale in Scienze Statistiche e Economiche (clamses-percorso STATA). Appunti approfonditi del corso presi in …

Esame Introduzione alla serie storiche

Facoltà Scienze statistiche

Dal corso del Prof. Maranzano Paolo

Università Università degli Studi di Milano - Bicocca

A.A. 2023-2024

98 pagine

Schemi e mappe concettuali

Scarica

Estratto del documento

DOMANDE:

→Cosa vuol dire che a ritardo 12 l’autocorrelazione assume valore 0,75? Vuol dire che un certo mese con lo

stesso mese dell’anno precedente ma anche con lo stesso mese dell’anno successivo l’autocorrelazione è del

75%.

→Cosa vuol dire che a ritardo 24 l’autocorrelazione assume valore 0,62? Vuol dire che un certo mese ha una

autocorrelazione di 0,62 con lo stesso mese di due anni prima e di due anni dopo…etc

→Cosa vuol dire che a ritardo 6 l’autocorrelazione assume valore -0,30? Vuol dire che un certo mese con il

sesto mese precedente ha un’autocorrelazione negativa di -0,30 e con lo stesso mese di 6 mesi dopo.

ATTENZIONE!! Questa interpretazione è generale ovvero non è inteso solo per un mese, come gennaio del

2022 è correlato o meno con gennaio del 2021, ovvero si interpreta che qualunque mese, perché posso dire

che il 75% di correlazione ce l’ho su gennaio 2022 con gennaio 2021 ma ce l’ho anche su febbraio 2022 e su

febbraio 2021...etc

Correlogramma parziale (PACF)

Lo stesso ragionamento si ripete sul correlogramma parziale, ovvero l’autocorrelazione al netto/ripulita da

tutti i ritardi intermedi.

→Grafico White Noise: (solo a ritardo 62 è fuori dalla banda di confidenza ma è casualità!) quindi a qualunque

ritardo l’autocorrelazione non è significativa pur tenendo conto dei ritardi intermedi.

pag. 50

→Grafico Random Walk: la versione dell’ACF parziale è completamente zero tranne per il primo ritardo,

questo ci dice che data la mia serie storica l’unico ritardo che conta nel determinare gli altri è il precedente

ovvero a ritardo 1. Quindi dalla pulizia dei ritardi intermedi l’unico che sopravvive è a ritardo 1 ovvero l’unico

che determina l’andamento della serie storica! L’autocorrelazione parziale è 1 o prossima ad 1 a ritardo 1 e

questo vuol dire che il valore di oggi è spiaccicato al valore di ieri per una leggera variazione casuale che è

esattamente la definizione di random walk. Quindi quando osservo un PACF così vuol dire che tutta l’ACF che

ho osservato nel grafico precedente in realtà la riconduco a questa situazione Y = Y +ε ovvero la definizione

t t-1 t

di random walk. Perché una volta depurato dai ritardi intermedi lui è l’unico che rimane e rimane con un

effetto che è prossimo al 100%!

→Dati reali-concentrazione giornaliere di NO2 a Milano Lambrate: (stagionali ma molto rumorose) anche

qui il primo ritardo è l’unico che sopravvive, gli altri bene o male vengono azzerati tutti perché hanno dei

valori molto bassi. Quindi vuol dire che qui c’è una forte persistenza nonostante io abbia eliminato gli effetti

intermedi. Ha un effetto significativo solo il primo ritardo, gli altri ritardi non generano un effetto significativo

e se ce l’hanno sono nascosti dal rumore.

→Dati reali-vendita di gasolio agricolo in Italia: conferma la teoria della stagionalità che si vedeva ad occhio

perché gli unici due ritardi parziali un po' più significativi degli altri sono il ritardo 1 e il ritardo 12, il ritardo 12

è proprio sintomo della stagionalità perché ogni 12 ritardi ho una correlazione talmente forte che pur

depurandola dagli effetti intermedi rimane questa autocorrelazione. Si ha anche il ritardo 1 significa che oltre

al 12 come ritardo rilevante c’è anche il ritardo 1, quindi la serie storica probabilmente sarà generata da un

processo che è stagionale ma ha anche una componente di ritardo a brevissimo termine quindi un mese

sull’altro. Il ritardo 1 indica il fatto che il passaggio da un mese all’altro è un passaggio abbastanza liscio.

In entrambi i grafici di ACF e PACF ci sono le bande di confidenza che corrispondono al Test di Bartlett per

l’assenza di autocorrelazione, cioè, posso costruire intervalli di confidenza che non dipendono dai ritardi

perché sono costanti per qualunque ritardo K (limite del Test di Bartlett).

Test di Bartlett

La seguente statistica test dell’intervallo di confidenza va a testare se una singola autocorrelazione a ritardo

K sia nulla (gli intervalli di confidenza non dipendono dai ritardi). Quindi per testare se una singola

autocorrelazione è statisticamente significativa (non nulla), si osserva se la singola funzione di

autocorrelazione si annulla dopo un certo ritardo (lag), cioè se ρ = 0 per k>m. Il test asintotico di Bartlett

utilizza come valori critici:

e come statistica test il valore dell’autocorrelazione campionaria ρ . Una generica autocorrelazione è

considerata nulla se il valore stimato esce dall’intervallo di confidenza. Graficamente, l’intervallo di confidenza

è rappresentato dalle rette orizzontali nelle ACF e PACF, più il campione è grande e più le bande si stringono

verso lo zero.

Limite: il fatto che gli intervalli di confidenza non dipendono dai ritardi non è il massimo perché i ritardi non

sono “uguali” fra di loro. Allora sono state sviluppate delle tipologie diverse del Test di Bartlett un po' più

sofisticate che sono i Test di Portmanteau.

pag. 51

Test Portmanteau: Box and Pierce (1970) e Ljung and Box (1978, 1979)

Questo test l’hanno creato perché a loro non andava bene che il ritardo fosse ininfluente nello stabilire se

una certa autocorrelazione fosse significativa o meno e quindi sviluppano questi due test.

Oltre alla verifica di ipotesi sui singoli coefficienti di autocorrelazione è possibile utilizzare un particolare test,

chiamato Portmanteau, che è stato proposto in due versioni: la prima dovuta a Box and Pierce (1970) e la

→

seconda a Ljung and Box (1978, 1979) si differenziano in base ai pesi che danno!

Entrambi i test verificano le ipotesi congiunte:

Ipotesi nulla: le prime K autocorrelazioni sono nulle ovvero il processo nei primi K ritardi è un White Noise;

Ipotesi alternativa: afferma che almeno un coefficiente di autocorrelazione all’interno dei k coeff. di

autocorrelazione risulta significativamente diverso da zero, e quindi conduca al rifiuto dell’ipotesi che la serie

sia la realizzazione di un processo White Noise.

L’idea è che si esegue il test un tot di volte fissando un K diverso ogni volta e a mano a mano che vado avanti

i rigetti dell’ipotesi diventano sempre di meno. In generale questi due test vengono chiamati test di

Portmanteau perché sono casi particolari della statistica Q.

La statistica test Q del test Portmanteau e la seguente:

h=sono i gradi di libertà che si utilizzano in un contesto regressivo ovvero

dove stimo un certo numero di parametri.

dove k è il ritardo massimo da testare, n è il numero totale di osservazioni, h è il numero di gradi di libertà

(scelti a seconda della serie storica) e w sono i pesi associati ad ogni autocorrelazione. Questo test prende le

autocorrelazioni le eleva al quadrato, le pesa fa la somma che viene moltiplicata per n; quindi, in sostanza

crea una combinazione lineare delle prime K autocorrelazioni al quadrato.

Interpretazione del test di Portmanteau: presi tutti insieme, ovvero in blocco, i primi k valori di

autocorrelazioni sono o non sono statisticamente significativi (anche se individualmente assumono valori

bassi), ovvero le prime k mi portano ad un’autocorrelazione forte oppure no? Sotto l’ipotesi nulla c’è che le

autocorrelazioni siano deboli e quindi l’autocorrelazione complessiva sia nulla (se ognuna delle

autocorrelazioni stimate è prossima a 0, allora la statistica test sarà piccola), contro l’ipotesi alternativa che ci

sia almeno un’autocorrelazione forte che stacca dalla situazione di White Noise. Nel caso in cui il test non

fosse rigettato, la serie sarebbe indistinguibile da un processo white noise, ovvero la serie rappresenterà un

processo white noise.

A prescindere che scelgo Box and Pierce o la seconda a Ljung and Box, è importante scegliere il valore di K

ovvero il ritardo. Un approccio è testare tutti i K che voglio dandogli un senso quindi per K crescente; in ogni

caso si osserva che il ritardo k influisce sulla qualità del test. Quindi è bene utilizzare una delle tre tecniche

proposte per la scelta dei ritardi:

• Per serie non stagionali il numero di ritardi k = 10; per serie stagionali il numero di ritardi è k = 2m, dove m

è la periodicità della serie storiche ad esempio se ho i dati mensili su base annuale m sarà uguale a 12 quindi

il ritardo è 24 (Hyndman and Athanasopoulos, 2018);

• Asintoticità del test: Per serie storiche lunghe k ≈ ln(n) (Tsay, 2005);

• Affinché il test sia attendibile, si usi al massimo un ritardo pari a k = n/5 (Hyndman and Athanasopoulos,

max

2018).

pag. 52

Problema dei gradi di libertà:

n rappresenta il numero totale di osservazioni nel campione, mentre h rappresenta il numero di gradi di

libertà (correzione) del test d’ipotesi. I gradi di libertà corrispondono al numero di parametri stimati del

modello di regressione che ha generato la serie storica.

• Se il test Portmanteau è applicato alla serie storica originale (dati grezzi), allora gradi di libertà h = 0 in

quanto non ho stimato alcun parametro per ottenere la serie storica in oggetto;

• Se il test Portmanteau è applicato alla serie storica dei residui di un modello di regressione, allora gradi di

libertà h = K + 1 corrisponde al numero di parametri stimati nel modello usato per ottenere la serie storica.

Test di Box and Pierce (1970)

(peso costante: uguale per tutti ed è unitario, quindi diventa una statistica non pesata. Quindi stiamo dicendo

implicitamente che il ritardo 8 ha lo stesso peso del ritardo 2 nonostante la distanza inizia a crescere).

∀i

Se ad ogni correlazione viene associato un peso costante pari a 1, i.e. w = 1 = 1, . . . , k, la statistica Q viene

chiamata statistica Q di Box and Pierce (1970), che diventa:

Test di Ljung and Box (1978, 1979)

(peso dinamico: pari al numero di osservazioni + 2 / numero di osservazioni – il ritardo i-esimo che sto

considerando).

Se ad ogni correlazione viene associato un peso che dipende dal numero di osservazioni e dai ritardi, i.e.

∀i

w = (n + 2) / (n – i) = 1, . . . , k, la statistica Q viene chiamata statistica Q di Ljung and Box (1978), che diventa:

Le statistiche Q e Q sono asintoticamente equivalenti quando il campione è grande.

BP LB

La differenza tra il Test di Bartlett e il Test di Portmanteau è che il Q e Q tengono conto del fatto che

BP LB

l’autocorrelzione si muova, sia dinamica e quindi ne devo tenere conto nel momento in cui testo la non

autocorrelazi

Anteprima

Vedrai una selezione di 20 pagine su 98