Estratto del documento

Serie storiche e processi stocastici

Introduzione

Desiderando introdurre intuitivamente il concetto di serie storica basta fare riferimento a qualsiasi fenomeno misurabile che varia nel tempo e la cui registrazione costituisce, appunto, la serie storica. Tale successione di dati rappresenta una informazione statistica sulla quale potremmo avere interesse, oltre che nel descrivere, anche nell’inferire (ovvero all’applicare gli strumenti propri dell’analisi statistica con scopi di previsione).

Più precisamente, per serie storica o serie temporale intendiamo una successione di osservazioni ordinate logicamente secondo una variabile t, la quale nella maggior parte dei casi rappresenta il tempo. Risulta quindi di interesse lo studio della dinamica temporale di tale serie (analisi univariata) e delle eventuali connessioni con altre serie storiche ad essa collegate (analisi multivariata). Confluiscono in questa analisi gli strumenti e i contributi della statistica, del calcolo della probabilità, dell’econometria e dell’analisi matematica.

Per questa trattazione le nozioni richieste in questi campi sono quelle di base di normali corsi universitari di analisi matematica, statistica descrittiva e inferenziale e qualche conoscenza di calcolo delle probabilità, principalmente con riguardo alle variabili casuali.

Volendo fare un primo banale esempio di serie storica si può considerare la successione = t 1,2,...,10 { X } dei prezzi di un titolo quotato in borsa nel periodo; questo risulterà t = quotazioni, e ne potrà seguire dall’osservazione e dalla registrazione di un totale di n = 10 un’opportuna rappresentazione grafica. = x (x1, x2,..., x10) = (8.5, 10.3, 9.6, 8.7, 11.2, 9.9, 7.9, 10, 9, 11.1)

Definizione di processo stocastico

Passiamo ora a definire la serie storica da una angolazione differente. Per fare questo ci serviremo della nozione di processo stocastico, uno strumento probabilistico ampiamente impiegato in molteplici ambiti, dalla fisica alla finanza, dall’economia al controllo statistico della qualità, e in molti altri campi.

Definizione: Un processo stocastico X (detto anche processo aleatorio e talvolta indicato con X(t) t appartenente ad un) è una famiglia di variabili casuali descritte da un parametro insieme parametrico T.

Cosa significa tutto questo?

Significa che un processo stocastico è una successione di variabili aleatorie ordinate secondo un parametro ∈ t T, solitamente identificato con il tempo. La conoscenza di un processo stocastico equivale alla conoscenza della distribuzione di probabilità multipla (multivariata) per qualsiasi sottoinsieme di T e per qualsiasi valore delle variabili casuali.

Occorre caratterizzare però ulteriormente questa nozione di processo stocastico; per fare questo introduciamo delle distinzioni. Parleremo di processo stocastico continuo qualora le variabili casuali che lo compongono siano di natura continua, di processo stocastico discreto in caso contrario; distingueremo inoltre fra processi stocastici a tempo continuo e a tempo discreto, nei casi, rispettivamente, che il parametro t ∈ T abbia supporto continuo o discreto.

Esempio

Sia X un processo stocastico che descrive le rilevazioni negli istanti temporali t ∈ T = {1,2,3,...} di una qualche grandezza fisica e le cui realizzazioni siano caratterizzate da leggi di distribuzione gaussiane. Allora il processo in esame sarà da definirsi come processo stocastico continuo a tempo discreto. Un tale processo è quindi la famiglia di variabili casuali {X1, X2,...} per la cui conoscenza occorre specificare le funzioni di densità congiunte di ciascuna combinazione di esse. Formalmente un processo X è noto se è nota la funzione di densità X(t1, t2,..., tk) per ogni k e per ogni k-pla di valori di variabili casuali.

Da questo si può già intuire l’estrema complicazione dello studio di un processo stocastico nella sua generalità, e in particolare la pratica impossibilità di inferire direttamente su di esso. Volendo descrivere meglio la struttura probabilistica di Xt possiamo osservare che, per esempio, fissando t = 3, si ottiene la variabile casuale X3, che possiede una sua propria funzione di densità di probabilità (nel caso continuo, di massa di probabilità nel caso discreto) che sarà correlata oppure no alle altre, e così via. Su X3 possiamo effettuare un esperimento e rilevare dei valori appartenenti al suo campo di variazione.

Estendendo a tutto il processo, se fissiamo una prova da effettuare su Xt (ovvero osserviamo la successione dei risultati campionari x1, x2,...) otterremo una successione di valori, funzione della variabile t, chiamata realizzazione o traiettoria del processo. Risulta evidente che, dato un processo Xt, esistono infinite possibili realizzazioni che sono precisamente tutte quelle osservabili ripetendo indefinitamente l’esperimento. Segue un esempio grafico di due realizzazioni campionarie dal medesimo processo.

Infine, se in Xt fissiamo t e contemporaneamente fissiamo la prova sperimentale (per esempio fissiamo t = 3 ed osserviamo il valore risultante per X3) otteniamo, ovviamente, un numero reale: cioè il valore realizzato per la variabile casuale fissata, ovvero il valore della realizzazione al tempo t fissato.

Possiamo quindi introdurre a questo punto l’intendimento di serie storica {xt, t = 1,2,...,N} come una parte finita di una realizzazione di un processo stocastico Xt. Tale definizione concorda con quella fornita nell’introduzione di serie storica come “successione di osservazioni ordinate logicamente secondo una variabile t” e qualifica inoltre in senso probabilistico la natura dei problemi che ci proponiamo di affrontare.

Per esempio la previsione di un valore del fenomeno in esame al tempo t = N + 1 noto che siano le osservazioni fino a diventa uno specifico problema di Calcolo delle Probabilità. Cioè: qual è la probabilità che la variabile casuale XN+1 assuma un determinato valore (e qui entra, ad esempio, la teoria dei test statistici) se su tale variabile si hanno informazioni derivate dall’insieme di variabili casuali (X1, X2,..., XN) che hanno generato la realizzazione finita (x1, x2,..., xN).

Si noti d’altro canto che una simile definizione mette in luce anche la limitazione delle informazioni sul processo le quali sono, in generale, desumibili dalla conoscenza della serie storica. Difatti essa non è altro che una parte finita di una singola realizzazione del processo; ci troviamo quindi a lavorare non solo con un campione unico della famiglia delle variabili casuali che caratterizzano il processo, ma si tratta anche di un campione troncato, poiché si osserva solo per t = 1,2,...,N. Tutto questo impone quindi una limitazione della classe dei processi stocastici, perché solo per una parte più ristretta di essi sarà possibile dedurre informazioni “consistenti” dalle realizzazioni finite di cui disponiamo nelle applicazioni reali.

Processi stocastici

Passiamo ora ad analizzare in modo più formale i processi stocastici e le loro caratterizzazioni fondamentali.

Rifacendoci alla definizione presentata nell’introduzione di processo stocastico, andiamo a fornirne ora una sorta di classificazione, sulla base delle variabili casuali componenti un processo e dei loro legami.

Una prima distinzione può essere fatta con riguardo all’indipendenza o meno delle variabili casuali componenti il processo. Tale stato difficilmente si riscontra nella realtà, l’unico processo a componenti incorrelate che tratteremo sarà il processo definito White Noise (rumore bianco) di valor medio nullo e varianza costante σ2 (cioè non dipendente da t). In seguito verrà indicato con A ∼ WN(0, σ2). Un processo stocastico WN è quindi caratterizzato come segue:

  • E(At) = 0
  • Var(At) = σ2 = E(At2) = costante per ogni t
  • Cov(At, As) = E(At As) = 0 per t ≠ s

Non vengono fatte a priori ipotesi sulla distribuzione di At, ma qualora si supponga che, per ogni t, sia anche una variabile casuale Normale, allora si parla di Processo White Noise Gaussiano. Poiché l’incorrelazione di variabili casuali Normali implica l’indipendenza, un processo WN Gaussiano è a componenti indipendenti.

Una seconda distinzione riguarda la legge di probabilità delle variabili casuali componenti. Possiamo infatti ipotizzare una prefissata funzione di densità (nel caso continuo) per tali variabili e definire di conseguenza il processo risultante (un risultato teorico noto come Teorema di Kolmogorov ci garantisce che, per ogni n intero, note che siano le densità di probabilità n-variate f(x1, x2,..., xn; t1, t2,..., tn), il processo stocastico è completamente caratterizzato).

L’ipotesi più comune è quella di supporre che le variabili casuali costituiscano una variabile aleatoria Multinormale per ogni (t1, t2,..., tk) e per ogni k ≥ 1. In tal caso il processo stocastico si definisce processo Gaussiano e possiede funzione di densità multivariata:

f(xt) = (2π)-N/2 |Σ|-1/2 exp(-1/2(x-μ)'Σ-1(x-μ))

dove μ = E(Xt) è il vettore dei valori medi e Σ = [Cov(Xt, Xt)] la matrice delle varianze e covarianze del processo.

È interessante soffermarsi sul fatto che un processo Gaussiano è caratterizzato solo da μ e Σ e quindi, per esempio, un processo Gaussiano di valore medio 0 per ogni t è caratterizzato esclusivamente dalla matrice delle varianze e covarianze delle variabili casuali Xt, Xi, Xj componenti il processo. Questa osservazione è di particolare rilievo perché ci dice che in una classe particolare e limitata di processi stocastici (quella Gaussiana ad esempio) la conoscenza del processo stocastico (e quindi di tutte le funzioni del processo) può essere ricondotta alla conoscenza di una particolare categoria di funzioni (quali possono essere i momenti misti ad esempio), a loro volta stimabili dalle realizzazioni finite (e quindi dalle serie storiche).

Altre distinzioni possono essere fatte con riguardo al comportamento della successione di variabili casuali rispetto al parametro t. Si tratta dunque di andare a vedere se le variabili risultino o meno in un qualche equilibrio dinamico rispetto al tempo, in termini di valore atteso, di varianza, di entrambi o di altre misure ancora. Se un processo stocastico Xt presenta una distribuzione di equilibrio quando t → ∞, ovvero sul piano delle realizzazioni è presente una certa “omogeneità temporale” di natura stocastica, allora potremo parlare di processo stocastico stazionario.

Più precisamente parleremo di processo stocastico stazionario in senso stretto o forte qualora la distribuzione multivariata delle variabili casuali (Xt1, Xt2,..., Xtk) non sia funzione di (t1, t2,..., tk) per ogni k ≥ 1. Formalmente:

(Xt1, Xt2,..., Xtk) ∼ (Xt1+j, Xt2+j,..., Xtk+j)

Ne consegue, per k = 1, che Xt ∼ Xt+j, e quindi tutte le “marginali” del processo sono identicamente distribuite, da cui avranno uguale media e varianza. E(Xt) = μ, Var(Xt) = σ2, ∀ t.

Analogamente, per k = 2, (Xt, Xt+1) ∼ (Xt+j, Xt+j+1). La distribuzione congiunta dipende solamente da t2-t1 e non dalla traslazione j. E così via crescendo in dimensione.

Ne consegue che se si considerano le componenti (Xt, Xt+h), ed esistono i momenti fino al secondo ordine, la covarianza dipende solo da h:

Cov(Xt, Xt+h) = E[(Xt - μ)(Xt+h - μ)] = γh

Per h = 0 la covarianza coincide con la varianza di Xt: γ0 = σ2 = Var(Xt).

Le covarianze di un processo stocastico stazionario in senso stretto sono funzioni di h = ±0,1,2,...

La funzione appena introdotta viene denominata funzione di autocovarianza del processo ed è una funzione simmetrica, infatti:

γh = γ-h = Cov(Xt, Xt+h).

Si definisce analogamente anche una funzione di autocorrelazione come segue:

ρh = γh0

Ed essendo inoltre ρ0 = 1.

La verifica dell’ipotesi di stazionarietà in senso stretto è nella maggior parte dei casi reali quasi impossibile, ci si limita dunque spesso a controllare che siano verificate delle condizioni meno forti e riguardanti solo i momenti fino al secondo ordine (media, varianza, covarianza). Un processo che rispetti tali proprietà è definito processo stocastico stazionario in senso lato o debole. Generalmente si considera solo quest’ultimo tipo di stazionarietà nelle applicazioni, riconducendo la verifica alle proprietà di media, varianza e autocovarianza. In particolare diremo che un processo è stazionario in senso lato se verifica le seguenti condizioni:

  • E(Xt) = μ, per ogni t
  • E(Xt2) - μ2 < +∞, per ogni t
  • E[(Xt - μ)(Xs - μ)] = γts ∀ (t, s)

La prima condizione richiede che il valor medio del processo sia costante e pari a μ al variare di t; la seconda impone che il processo abbia varianza σ2 finita e costante al variare di t; l’ultima condizione infine implica che per ogni t e s esista la funzione di autocovarianza fra le variabili Xt e Xs. Tutto questo implica l’esistenza dei momenti fino al secondo ordine, ma non viene imposta alcuna condizione necessaria sulle funzioni di densità multivariate che caratterizzano il processo Xt.

Da questo discende che mentre la stazionarietà in senso stretto implica, quando esistano i momenti fino al secondo ordine, quella in senso lato, non vale il contrario.

Per quale motivo nella pratica risultano solitamente sufficienti le condizioni deboli di stazionarietà del processo? Questo è giustificato dal ruolo fondamentale giocato dalla distribuzione Normale nello studio di molti fenomeni fisici e naturali, per i quali è valido il Teorema del Limite Centrale: dal momento che, sotto ipotesi di gaussianità, le condizioni di stazionarietà debole sono sufficienti per avere anche la stazionarietà in senso forte, questo garantisce di potere evitare la complicata (quando non impossibile) verifica in molteplici situazioni.

Un’altra proprietà che, come le precedenti, un processo può possedere o meno, è l’invertibilità. Si tratta della possibilità di esprimere un processo Xt tramite le variabili casuali precedenti secondo l’ordine logico imposto dal parametro t (e quindi ad esempio precedenti temporalmente); formalmente significa che esistono una funzione lineare h() ed un processo WN (White Noise) tali che, per ogni t, sia possibile scrivere:

Xt = h(Xt-1, Xt-2,...) + At

Quindi la funzione h() collega Xt con le variabili Xs (s < t), e a tale relazione si aggiunge il processo At per rendere la stocasticità del processo (in assenza si tratterebbe né più né meno che di una funzione deterministica di t). L’invertibilità diventa particolarmente rilevante nello studio di alcuni modelli che presenteremo in seguito, ma già da qui si può intuire come possa risultare importante in un’ottica di previsione, in effetti si tratta della possibilità di regredire il nostro processo stocastico sui suoi valori passati.

Esiste anche un’altra classificazione che distingue i cosiddetti processi periodici. Formalmente diremo che Xt è un processo periodico se esiste un valore s tale che, per ogni t = t+s, Pr{Xt = Xt+s} = 1.

Dunque un processo periodico si ripete identicamente dopo s unità temporali. Se questo s è esattamente pari all’anno solare (s = 1 per dati annuali, s = 2 per dati semestrali, s = 4 per dati trimestrali, e così via) allora diremo che il processo periodico è stagionale.

Esistono altri tipi di classificazione di cui non tratteremo, ad eccezione della proprietà di ergodicità che verrà presentata in seguito. Tutte queste definizioni fanno riferimento ai processi stocastici e non alle serie storiche.

Anteprima
Vedrai una selezione di 10 pagine su 44
Statistica economica - serie storiche Pag. 1 Statistica economica - serie storiche Pag. 2
Anteprima di 10 pagg. su 44.
Scarica il documento per vederlo tutto.
Statistica economica - serie storiche Pag. 6
Anteprima di 10 pagg. su 44.
Scarica il documento per vederlo tutto.
Statistica economica - serie storiche Pag. 11
Anteprima di 10 pagg. su 44.
Scarica il documento per vederlo tutto.
Statistica economica - serie storiche Pag. 16
Anteprima di 10 pagg. su 44.
Scarica il documento per vederlo tutto.
Statistica economica - serie storiche Pag. 21
Anteprima di 10 pagg. su 44.
Scarica il documento per vederlo tutto.
Statistica economica - serie storiche Pag. 26
Anteprima di 10 pagg. su 44.
Scarica il documento per vederlo tutto.
Statistica economica - serie storiche Pag. 31
Anteprima di 10 pagg. su 44.
Scarica il documento per vederlo tutto.
Statistica economica - serie storiche Pag. 36
Anteprima di 10 pagg. su 44.
Scarica il documento per vederlo tutto.
Statistica economica - serie storiche Pag. 41
1 su 44
D/illustrazione/soddisfatti o rimborsati
Acquista con carta o PayPal
Scarica i documenti tutte le volte che vuoi
Dettagli
SSD
Scienze economiche e statistiche SECS-S/03 Statistica economica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher flaviael di informazioni apprese con la frequenza delle lezioni di Statistica economica e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Firenze o del prof Buzzigoli Lucia.
Appunti correlati Invia appunti e guadagna

Domande e risposte

Hai bisogno di aiuto?
Chiedi alla community