MODELLI DI SERIE STORICHE
APROCCIO CLASSICO
Modelli di composizione, componenti:
Trend: è la tendenza di fondo del fenomeno considerato, riferita ad un lungo periodo
di tempo.
(Ex: PIL italiano, la crescita di lungo periodo del 3%)
Ciclo: è costituito dalle fluttuazioni attribuibili al succedersi nel fenomeno
considerato di fasi ascendenti e di fasi discendenti, generalmente collegate con le fasi
si espansione e di contrazione dell’intero sistema economico.
(Ex: PIL italiano, fasi di boom economico contrapposte a fasi di recessione)
Stagionalità: è costituita dai movimenti del fenomeno nel corso dell’anno che, per
effetto dell’influenza di fattori climatici e sociali, tendono a ripetersi in maniera
pressoché analoga nel medesimo periodo (mese o trimestre). (Ex: PIL italiano, nel
mese di Agosto tutte le grandi fabbriche sono chiuse)
Componente accidentale: come nel modello di regressione, anche nei modelli di
serie storiche non vi è mai una relazione perfetta tra la variabile sotto osservazione e
le diverse componenti, la componente accidentale tiene conto di questo e del
comportamento non perfettamente prevedibile degli agenti economici.
Tipi di composizione :
1) additività
2) moltiplicatività
3) misto
1) ipotesi di indipendenza tra le componenti 1
modello additivo:
Z T C S a
t t t t t
2) non indipendenza tra le componenti
modello moltiplicativo
Z T C S a
t t t t t
Il caso 2) si riduce al caso 1) considerando i logaritmi , cioè :
log Z log T log C log S log a
t t t t t
3) modello misto:
Z T S C a
t t t t t
pregi
-semplicità
-serie anche corte
-prima approssimazione
difetti
-pluralità di soluzioni
-assunzione modellistica troppo rigida
-visione settorizzata 2
IL TREND
280
240
200
160
120
80
40 1960 1965 1970 1975 1980 1985 1990
Il trend di una serie storica è la tendenza di fondo del fenomeno nel lungo
periodo. Si caratterizza per un’evoluzione lenta e regolare nel tempo. In
genere è rappresentabile mediante una qualche funzione del tempo da
stimare. n
{ }
Data una serie storica per la quale ipotizziamo un modello del tipo
y t t 1
2
:
Y f ( t ) WN (0, )
e e s
(1.)
t t t e
supponiamo per la nostra analisi che la parte sistematica f(t) della serie sia
composta dal solo trend.
Come si rappresenta f(t)? 3
Nota, a meno di un insieme di parametri
Lineare nei Non lineare nei
parametri parametri
f(t) Non nota, ma approssimabile mediante
combinazione lineare di funzioni note (un
polinomio, termini trigonometrici…)
Non nota e non approssimabile
Procedure di smoothing
1. Trend lineare o linearizzabile nei parametri
Tali trend sono stimabili attraverso le procedure derivate dal modello di
regressione lineare.
- Trend polinomiale 2 q
f ( t ) t t ... t
a a a a
0 1 2 q
La (1.) diventa il modello di regressione lineare:
2 q
a a a a e
y t t ... t t 1,2,..., n
t 0 1 2 q t
Che può essere espressa in forma matriciale : 4
a e
y P
con a e
y é ù
é ù é ù
0
1 1
ê ú
ê ú ê ú
a e
y ê ú
ê ú ê ú
1
2 2
a e
y , ,
ê ú
ê ú ê ú
⋮
⋮ ⋮
ê ú
ê ú ê ú
a e
y
ê ú ê ú
ê ú
ë û ë û
ë û
q
n n
e 2 q
é ù
⋯
1 1 1 1
ê ú
2 q
⋯
1 2 2 2
ê ú
P ê ú
⋮ ⋮ ⋮ ⋱ ⋮
ê ú
2 q
ê ú
⋯
1 n n n
ë û
e stimata con il metodo dei minimi quadrati, dal quale si ottengono le
stime del vettore a 1
-
ˆ
a (
P ' P ) P ' y
ATTENZIONE: il polinomio stimato può essere usato a fini interpolativi,
ma deve essere usato con molta cautela per fini previsivi.
L’orine q del polinomio dipende dal comportamento di fondo della serie
storica. Di solito si sceglie q abbastanza piccolo perché altrimenti si
perdono gradi di libertà.
I più usati sono:
q 0 Y trend costante
a e
t 0 t
q 1 Y t trend lineare
a a e
t 0 1 t 2
q 2 Y t t trend parabolico
a a a e
t 0 1 2 t 5
Come scegliere q?
A. Criterio delle differenze successive
Indichiamo B l’operatore ritardo che trasforma la serie y in
t
y =B y .
t-1 t
h
Per cui B y =y
t t-h
0
Definiamo B =I operatore identità (lascia immutata la serie) Iy =y
t t
Si chiama operatore differenza prima all’indietro (I-B) per il quale
(I-B)y = y - y
t t t-1
- L’operazione differenza prima su di un polinomio ne riduce il grado
q
In generale se f(t) è un polinomio di grado q, (I-B) f(t) è costante.
Es.
f ( t ) t
a a
0 1
(
I B )
f ( t ) f ( t ) f ( t 1)
- - -
t ( t 1)
a a a a a
- - -
0 1 0 1 1
Tale risultato può essere utilizzato per individuare il trend polinomiale. Si
calcolano le differenze successive della serie, arrestando l’operazione per
r
un certo valore r per il quale la serie (I-B) y sia approssimativamente
t
costante.
ATTENZIONE:L’operatore B fa sentire i suoi effetti sulla componente
accidentale ε , aumentando marcatamente la varianza della serie.
t 6
80
40
0
-40
-80
-120 1960 1965 1970 1975 1980 1985 1990
Y
B. Il confronto tra 2
R
Come è noto dalla regressione, l’aggiunta di una nuova variabile nel
2
modello provoca un aumento del coefficiente di determinazione lineare R .
2r
Dunque se indichiamo con R il coefficiente di determinazione lineare
2r+1
calcolato su una regressione polinomiale di grado r, ed R il coefficiente
di determinazione lineare calcolato su una regressione polinomiale di
2r 2r+1
≤
grado r+1, si ha sempre R R . Non è invece detto che ciò accada per il
coefficiente corretto .
2
R
Dunque in tal senso un criterio di scelta del grado del polinomio è : si
2 2
sceglie un grado r se , altrimenti si procede con la ricerca.
R R
³
r r 1
Inoltre è utile verificare la significatività del coefficiente associato
all’ultimo repressore introdotto.
Es. 7
r 0 1 2 3 4 5
2 0 0,478 0,665 0,701 0,698 0,667
R r - Trend esponenziale
Adatto a fenomeni caratterizzati da una crescita nel tempo “esplosiva”.
a t
1 (2.)
a
f ( t ) e
0
Con α >0 e l’andamento dipende da α
0 1
La derivata della 2. rappresenta il tasso di crescita della curva al tempo t .
df ( t ) a
/ f ( t )
Il tasso di crescita relativo è costante.
1
dt
0,1
t
f ( t ) 0,1
e
Es.
20
18
16
14
12
10
8
6
4
2
0 1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52
La trasformata logaritmica della 2. è la retta
α + α
log f(t)=log t
0 1
Dunque α
(I-B)logf(t) = 1
Possiamo utilizzare queste caratteristiche per individuare una curva con
trend esponenziale. 8
5
4
3
2
1
0 1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52
-1
-2 e
Sfruttando la trasformazione è possibile stimare i parametri α α
0 1
Per far questo bisogna però utilizzare un modello di tipo moltiplicativo:
a t
e a e
y f ( t ) e
× ×
1
t t 0 t
da cui a a e
log y log t log
t 0 1 t
* *
a a e
t
0 1 t )≠f(t)
ATTENZIONE: la stima è distorta E(y , anche la previsione risulta
t
distorta.
Se si utilizza la specificazione del modello additiva
a t
a e
y e
1
t 0 t
Non è lineare e non linearizzabile nei parametri. Utilizzando i minimi
quadrati si ha un sistema non lineare nei parametri e la soluzione è
raggiungibile solo per via iterativa. 9
2. TREND NON LINEARE NEI PARAMETRI: CURVE DI CRESCITA
Sono trend non riconducibili a quelli polinomiali in t; sono legati a
fenomeni caratterizzati da crescite molto accelerate. Le curve utilizzate
non sono più lineari nei parametri.
- Curva esponenziale modificata
Tasso di crescita al tempo t direttamente proporzionale all’ammontare
di crescita ancora da raggiungere.
kt
-
f ( t ) (1 e )
a b
-
con >0 determina l'intersezione della curva con l'asse verticale
b
>0 denota il valore limite di crescita ed è anche fattore di scala della funzione
a
k costante di proporzionalità che controlla la scala lungo l'asse dei tempi
Es. curva esponenziale modificata per vari valori di β
t
-
b
f ( t ) 1 e
-
1,2
1
0,8 Β=0,8
0,6 Β=0,4
Β=0,1
0,4
0,2
0 1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31
Usualmente la curva si trova nella forma
* t
b
f (
t ) e
b b
2
0 1 *
con 0 0 e k 0
b a b ab b
> - < - <
0 1 2 10
Tale curva differisce da quella esponenziale semplice per la presenza della
β
costante o asintoto superiore .
0
Non è linearizzabile tramite trasformazione logaritmica, tuttavia la
β -f(t) è un’esponenziale linearizzabile e, conoscendo il
differenza 0
valore dell’asintoto (spesso fissato dall’esterno), potremmo
stimare i parametri come fatto in precedenza con la trasformazione
logaritmica.
- La curva logistica
In questo caso tasso di crescita direttamente proporzionale al
prodotto tra il livello raggiunto e l’ammontare di crescita ancora
da raggiungere (con k>0 fattore di proporzionalità e valore
a>0
limite della crescita).
a
f ( t ) con >0
b
kt
-
1 e
b
Da notare: determina la scala della funzione;
a
k determina la scala lungo l’asse dei tempi cioè
l’inclinazione della funzione;
β determina il punto d’incontro della curva con
l’asse verticale. 11
kt
-
Es. f ( t ) 1/(1 e )
1,2
1
0,8 Serie1
0,6 Serie2
Serie3
0,4
0,2
0 7 1
0 4 1 4 7
-8 -2 10 13 16
-5
-1 -1
-2 -1
1,2
1
0,8 k=4
0,6 k=1
k=1/4
0,4
0,2
0 1 4 7 10 13 16 19 22 25 28 31 34 37 40 43 46 49 52 55
Prendendo il reciproco 1/f(t) e ridefinendo le variabili si ottiene una
esponenziale modificata.
b
1 1 kt
-
e
a a
f ( t )
* * * kt
-
a b
f ( t ) e
12
- La curva di Gompertz
{ }
kt
-
f ( t ) exp e con >0
a b b
-
La curva ha una forma ad S allungata simile alla logistica (senza la
simmetria attorno al punto di flesso). α, β e K hanno la stessa
interpretazione di quelli nella logistica e logf(t) è un’esponenziale
modificata.
Es. K=1
a=1
1,2
1
0,8 Serie1
Serie2
0,6 Serie3
Serie4
0,4
0,2
0 0 6
4 2 0 4 8
-4 16 20 24
-8 12
-2 -1
-2 -1
1,2
1
0,8 B=1/8
B=1
0,6 B=8
B=64
0,4
0,2
0 1 3 5 7 9 11 13 15 17 19 21 23 25 27 13
La componente stagionale
Anche questa componente, come il trend, può essere stimata con il
modello di regressione. Si rappresenta mediante una funzione periodica
g(t).
╔ Si dicono periodiche quelle funzioni il cui valore all’istante t si
riproduce esattamente ad intervalli costanti, la cui lunghezza s costituisce
il periodo
g(t)=g(t+s)=g(t+2s)=g(t+3s)=…
s=4 serie trimestrale s=12 serie mensile ╝
Supponiamo che il processo sia del tipo
+ε
Y =S
t t t
Come si tratta tale componente nel modello di regressione?
Variabili ausiliarie dicotomiche (dummy)
A) S
g ( t ) d t=1,2,...,n
g
å j jt
j 1
dove d è una variabile dummy:
jt 1 nel periodo j-esimo dell'anno a cui appartiene t j=1,...,s
ì
d í
jt 0 altrimenti t=1,...,n
î
Nel caso di una s.s. trimestrale il modello associato è
y D
g e
dove 1 0 0 0
é ù
ê ú
0 1 0 0
ê ú
ê ú g
0 0 1 0 é ù
1
ê ú ê ú
g
0 0 0 1
ê ú ê ú
2
D g
ê ú ê ú
g
1 0 0 0 3
ê ú ê ú
g
0 1 0 0
ê ú ë û
4
ê ú
⋮ ⋮ ⋮ ⋮
ê ú
0 0 0 1
ê ú
ë û
Al solito * 1
-
ˆ ( D ' D ) D ' y
g
Dove i coefficienti stimati sono detti coefficienti grezzi di stagionalità
Dunque la componente stagionale è data da
*
ˆ ˆ
g D
g
14
La serie destagionalizzata coincide con quella dei residui:
*d *
ˆ
y = y - D = e
g
B) L’uso di funzioni trigonometriche
2 i
p
m
S A cos( t )
f
-
å
t i i
s
i 1
La componente stagionale è data dalla somma di m armoniche con
s/i periodo
2 i
p frequenza angolare
w
i s
A ampiezza
i angolo di fase
f
i
Ad es: per dati mensili s=12, la prima armonica (i=1)
1,5
1
0,5
0 0 3 6 9 12 15 18 21 24 27 30 33 36 39
-0,5
-1
-1,5
completa il ciclo in 12 periodi.
Combinando tale modello con un trend polinomiale di grado q si ha:
m
q
y t ... t A cos( t )
a a a w f e
-
å
t 0 1 q i i i t
i 1
Che sfruttando l’identità trigonometrica diventa
m
q
y t ... t cos t sen t
a a a b w b w e
å
t 0 1 q i 1 i i 2 i t
i 1
b f b f
Con e
× ×
A cos( ) A sin( )
i
1 i i i 2 i i
Che può essere comunque stimato con l’usuale metodo dei minimi
quadrati. 15
STIMA SIMULTANEA DI TREND E STAGIONALITA’.
In forma matriciale: + Dγ + ε
y Pα
[ ] ε
y P Dθ
a
é ù
dove q ê ú
g
ë û
Le cui stime sono: 1
-
ˆ P ' P P ' D P ' y
a
é ù é ù é ù
ê ú ê ú ê ú
ˆ D ' P D ' D D ' y
g
ë û ë û ë û
E la serie destagionalizzata si ottiene
d ˆ
y y D
g
- 16
Medie mobili
Quando siamo di fronte ad un fenomeno con un andamento molto
irregolare che richiederebbe, dal punto di vista analitico, approssimazioni
con polinomi di grado molto elevato, si può provare ad individuare la
componente di fondo senza evidenziarne la legge sottostante.
Uno strumento utile a tal fine è la media mobile, utilizzata per stimare il
trend, destagionalizzare ed eliminare o ridurre la componente erratica.
Data una serie storica per cui valga il modello additivo:
+ε
Y =T +S
t t t t
Dobbiamo trovare una trasformazione che, ad esempio, conservi il trend ed
annulli le altre componenti. La media mobile consente tutto ciò.
La trasformazione della serie Y è una somma pesata dei valori della serie
t
originale corrispondenti ad istanti temporali intorno a t.
*
y y y ... y
J J J
t m t m m 1 t m 1 m t m
- - - -
1 1 1 1 2 2
cioè m
2
*
y y
J
å
t i t i
i m
- 1
Il numero dei termini utilizzati (m +m +1) è detto ordine della media
1 2
mobile.
Può essere scritta anche attraverso l’operatore ritardo B:
m
é ù
2
* i
-
y B y My
J
å
ê ú
t i t t
ë û
i m
- 1 ottenendo una combinazione lineare finita con pesi
J di potenze successive di B.
i
Se i pesi sono tutti uguali, si ha la media mobile semplice
1
J
i m m 1
1 2
e se m m m
1 2
1 m
*
y y
å
t t i
2
m 1
i m
-
Tale media mobile è detta centrata.
ES. T 1998 1999 2000 2001 2002 2003 2004
Y 6 7 14 3 13 5 15
t 6 7 14
*
Se m=1 …..
y 9
1999 3 17
La media mobile gode della proprietà di composizione, cioè si
possono applicare più medie mobili ad una serie, anche in sequenza e
cambiando l’ordine della loro applicazione ottengo lo stesso risultato.
Una media mobile è simmetrica se è centrata e se sono uguali i
coefficienti aventi indice simmetrico rispe
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.