vuoi
o PayPal
tutte le volte che vuoi
acf(pil,ylim=c(-1,1), lag=30) acf(‘pil’,ylim=larghezza bande, lag=n.correlazioni osservate)
Il Grafico sopra mostra stagionalita’, ogni 12 mesi si hanno picchi positivi ed una
sottoserie stagionale si trova anche ogni 4 mesi, non mostra trend poiche’ i valori fra
loro vicini non mostrano lenta decrescita. valori ritardati
l’autocorrelazione misura la forza della relazione lineare tra di una
serie storica.
Trend e stagionalità nei grafici ACF
Quando i dati presentano un trend, le autocorrelazioni per ritardi piccoli
tendono ad essere più grandi e positive poiché le osservazioni vicine nel
tempo sono anche vicine in valore. Quindi l’ACF di una serie storica con
trend tende ad assumere valori positivi che diminuiscono lentamente
all’aumentare dei ritardi.
Quando i dati presentano stagionalità, le autocorrelazioni saranno più
grandi per i ritardi stagionali (ai multipli del periodo di stagionalità)
rispetto agli altri ritardi.
Quando i dati presentano sia trend che stagionalità, è possibile vedere una
combinazione di questi effetti.
La corrispondente ACF è rappresentata in figura 2.21 . Il lento calo dell’ACF
all’aumentare dei ritardi è dovuto al trend, mentre le “merlature” sono dovuta alla
stagionalità.
pacf(pil,ylim=c(-1,1),lag=30)
Interpretazione del Correlogramma:
Se le autocorrelazioni ACF e PACF tendono ad annullarsi a velocita’
esponenziale al crescere di K allora: Il processo stocastico e’ stazionario
e ci avvarremo di un modello di tipo ARMA (p,q)
Se invece ACF,PACF, tendono ad annullarsi lentamente il processo non e’
stazionario e sara’ necessario ricorrere ad una trasformazione.
Ad esempio, nel caso di un Trend la non stazionarieta’ verra’ rimossa differenziando d
volte i dati.
Una volta resa stazionaria la serie si potra’ cercare di identificare uno specifico
modello mediante CORRELOGRAMMA:
MA(q) se:
a) ACF e’ diverso da zero per k<=q e si annulla per k>q
b) PACF tende a zero
AR(p) se:
a) ACF tende a zero con comportamento dipendente dai parametri
b) PACF e’ diverso da zero per k<=p e si annulla per k>p
Se non vi sono evidenze che facciano scegliere un processo AR o MA ci si avvale di
un ARMA (p,q)
Riguardo alle Funzioni ACF e PACF
se i grafici delle funzioni ACF e PACF della serie, eventualmente differenziata,
mostrano i seguenti comportamenti:
la funzione di autocorrelazione globale (ACF) decresce verso lo zero in
modo esponenziale o sinusoidale; p
nella PACF, l’autocorrelazione a ritardo è significativa, ma tutte le
p
altre autocorrelazioni oltre il ritardo non lo sono, potremo utilizzare
un grafico di tipo ARIMA (p,d,0) d q
Viceversa, la serie potrebbe essere modellata da un ARIMA(0, , ) se le
funzioni di autocorrelazione empiriche ACF e PACF della serie, eventualmente
differenziata, mostrano i seguenti comportamenti:
la funzione di autocorrelazione parziale (PACF) decresce verso lo zero in
modo esponenziale o sinusoidale; q
nella ACF, l’autocorrelazione a ritardo è significativa, ma tutte le altre
p
autocorrelazioni oltre il ritardo non lo sono.
boxplot(pil)
le scatole (box) includono il 50% delle osservazioni;
il bordo inferiore delle scatole corrisponde al 25° percentile o primo quartile (Q );
→ 1
la linea interna alle scatole corrisponde al 50° percentile o secondo quartile (Q )
→ 2
ovvero alla mediana;
il bordo superiore delle scatole corrisponde al 75° percentile o terzo quartile (Q );
→ 3
i baf (whiskers) corrispondono al valore minimo (baffo inferiore) e al valore massimo (baffo
→
superiore) osservati dopo avere escluso gli outliers (vedi sotto);
la differenza interquartile viene definita come IQR = Q – Q differenza tra il valore
→ 3 1
corrispondente al terzo quartile (Q ) e il valore corrispondente al primi quartile (Q );
3 1
i valori inferiori a Q - 1.5 · IQR e i valori superiori a Q + 1.5 · IQR sono
→ 2 2
considerati outliers (dati anomali o dati aberranti), sono esclusi dal computo dei valori minimo
e massimo e sono riportati come punti singoli separati.
hist(pil) Comando per realizzare un Istogramma
hist(pil,probability=T) stesso grafico dell’Istogramma ma con diversa densita’
lines(density(pil)) aggiunge una “linea” ad un grafico: