vuoi
o PayPal
tutte le volte che vuoi
PARTE TERZA “RICHIAMI DI INFERENZA STATISTICA”
1.2 Teoria dei test
Ipotesi statistica
Con tale termine si intende un’affermazione riguardante la forma di una distribuzione di densità o di
probabilità della popolazione (ipotesi funzionale) oppure il valore assunto da un parametro caratteristico
della stessa (ipotesi parametrica). Si distinguono due ipotesi contrapposte:
H è l’ipotesi nulla, preesistente all’osservazione dei dati campionati e vera fino a prova contraria.
• 0
H è l’ipotesi alternativa.
• 1
L’obiettivo dell’intera statistica test è quello di trovare una regola di decisione che consenta di accettare una
delle due ipotesi, tale regola viene enunciata da determinati test statistici.
Statistica test e valore critico
La prima è una statistica campionaria la cui distribuzione deve essere completamente nota sotto l’ipotesi
nulla mentre il secondo è un valore della statistica test corrispondente ad un certo valore di probabilità; di
solito la regola di decisione si basa tramite un confronto tra la funzione test e il valore critico: ad esempio, se
la funzione test è < del valore critico accetto una determinata ipotesi mentre in caso contrario accetto
l’ipotesi alternativa.
L’insieme dei valori della statistica test che portano all’accettazione dell’ipotesi nulla è detta regione di
accettazione mentre l’insieme dei valori rimanenti si chiama regione di rifiuto.
Errori e probabilità di errore 3 di 8
α viene definita come livello di significatività del test ed è la probabilità di commettere l’errore del I tipo.
(1 -β) viene definita come potenza del test e corrisponde alla probabilità di rifiutare l’ipotesi nulla quando
essa è falsa. Scopo del test è la minimizzazione di entrambe le tipologie di errore, tale obiettivo viene
perseguito prefissando α e utilizzando un test che minimizzi β.
P-value
Lo troviamo nell’output di software statistici come R, si tratta della probabilità di osservare un valore della
statistica test uguale o maggiore del valore ottenuto dal campione, sotto l’ipotesi nulla
Test di Normalità di Jarque Bera
Ipotesi nulla = la serie storica si distribuisce come una variabile casuale Normale, JB = 0
Ipotesi alternativa = la serie storica non si distribuisce come una Normale, JB diverso da 0
sotto H si distribuisce asintoticamente come una Chi-quadrato con 2 gradi di libertà.
0
Test Dickey-Fuller
Viene introdotto il concetto di stazionarietà di una serie storica il quale può essere inteso in senso forte
quando la funzione di ripartizione rimane invariata con il
trascorrere del tempo oppure in senso debole quando
parametri come la media (stazionarietà in media), la
varianza (stazionarietà in varianza) e l’autocovarianza
(stazionarietà in autocovarianza).
Test di Eteroschedasticità
Ipotesi nulla = la serie storica è stazionaria in varianza (omoschedastica)
Ipotesi alternativa = la serie storica non è stazionaria in varianza (eteroschedastica) 4 di 8
si distribuisce come una variabile casuale di Snedecor con gradi di libertà m per numeratore e
denominatore.
Test di Ljung-Box
Verifica la stazionarietà in autocovarianza.
Sotto l’ipotesi nulla, la funzione test si distribuisce come una chi-quadrato con m gradi di libertà.
CAPITOLO SECONDO “MODELLI DI BREVE E MEDIO PERIODO”
Data una certa serie storica l’obiettivo di questa tipologia di analisi è quello di capire quale sia il suo “modello
generatore” in modo da descrivere e prevederne l’andamento futuro. In particolare, una serie storica può
essere concepita come la risultante di due componenti distinte:
- la componente sistematica, la quale ha diverse configurazioni a seconda dell’orizzonte temporale scelto e
della periodicità di rilevazione del fenomeno;
- la componente residuale, il cui andamento nel tempo è regolato da leggi che non possono essere
formulate in modo deterministico e può essere ricondotto ad un particolare processo stocastico detto
“white noise”.
La componente di fondo
Può essere definita come la tendenza che una serie mostra in un orizzonte temporale di medio/lungo
termine. Un primo tipo di modelli è basato su funzioni parametriche nel dominio del tempo: ad esempio,
possiamo parlare di andamento lineare e di andamento esponenziale.
Il metodo dei minimi quadrati è quello più utilizzato per la stima dei parametri del modello.
Componente di fondo con andamento costante
La previsione del comportamento della componente di fondo nei fatti è una
previsione per tutte le unità temporali successive a T, aggiornando di volta in volta
la stima via via che si rendono disponibili nuove informazioni: bisogna, cioè, tenere
conto dell’errore di previsione
Componente di fondo con andamento lineare
Si tratta di fare ricorso alla cosiddetta retta di regressione.
Per quanto riguarda i due coefficienti della retta abbiamo 5 di 8
Mentre la previsione per le unità successive a T sarà data dalla seguente formula
Componente di fondo con andamento esponenziale
Applicando la trasformata logaritmica al modello di componente di fondo lineare si hanno i seguenti due
parametri
Mentre per quanto riguarda la previsione facciamo riferimento alla formula
Scelta del miglior modello per la componente di fondo
2
Maggiore è l’indice di adattamento R migliore è il modello così come minore è la varianza residua migliore è
il modello; se il p-value del test F e del test T è < 0.05 allora il modello va bene e la variabile può essere
tenuta nel modello.
La componente stagionale
Come dice il nome, si tratta di variazioni della serie storica che intervengono periodicamente. Attraverso il
calcolo delle medie mobili è possibile calcolare opportuni coefficienti in grado di rappresentare le varie
stagionalità che intervengono nell’andamento di una serie storica oppure di destagionalizzare la serie storica
stessa. Leggere differenze si riscontrano nel calcolo di questi coefficienti a causa dell’adozione di un modello
moltiplicativo o modello additivo.
CAPITOLO TERZO “MODELLI AUTOADATTIVI”
Livellamento esponenziale
Si tratta di un metodo globale che corregge le previsioni ottenute in relazione agli errori commessi; è di
semplice applicazione e ha costi di realizzazione contenuti ma la serie storica a cui deve essere applicato
non deve essere eccessivamente lunga e si adatta con ritardo ai cambiamenti di svolta della serie stessa. La
scelta della costante di livellamento α può essere soggettiva quando viene associata ad un valore tra 0 e 0.3
in quanto per valori più elevati il modello diventerebbe sempre più sensibile agli errori commessi oppure
statistica quando si vuole minimizzare una funzione di perdita quadratica legata agli errori di previsione sul
campioni di stima.
Modelli Holt-Winters
Si caratterizzano per due tipi di equazioni che sono presenti in ogni modello:
- aggiornamento
- previsione
Questi modelli si suddividono in non stagionali, stagionali moltiplicativi e stagionali additivi. Tutte e tre le
tipologie sono a loro suddivise nelle tre fattispecie della componente di fondo: modello costante (assenza di
trend), modello lineare e modello esponenziale.
PARTE QUARTA “RICHIAMI SUI PROCESSI STOCASTICI”
I modelli Arima sono un approccio che consente di individuare il miglior modello per la singola serie storica;
essi consentono di effettuare previsioni accurate ma su serie storiche lunghe e sono relativamente costosi in
termini di applicazione. Un processo stocastico è un insieme ordinato di variabili casuali; è stazionario
quando la famiglia delle ripartizioni finite è invariante per traslazioni temporali. 6 di 8
Modello autoregressivo di ordine p
Il modello è costituito dalla regressione di X con sé stessa ritardata fino al lag p; questo modello, detto AR, è
t
sempre invertibile mentre è stazionario se e solo se tutte le p-radici dell’equazione caratteristica sono, in
modulo, maggiori di 1.
Modello a media mobile di ordine q
Può accadere che un certo fenomeno possa essere rappresentato da uno schema nel quale le innovazioni
abbiano un’influenza particolare su X ma che dopo un certo periodo il loro effetto scompare; questo modello,
t
detto MA, ha le stesse condizioni di stazionarietà e di invertibilità del modello AR (q).
Modello autoregressivo media mobile di ordine p,q
Contiene sia i caratteri dello schema autoregressivo sia quelli dello schema a media mobile, viene indicato
con l’acronimo ARMA.
Modelli per serie evolutive
Questi modelli sono quelli adatti alle serie storiche non stazionarie, cioè a quelle serie che sono
maggiormente frequenti nelle applicazioni economiche. In particolare un modello ARMA può essere
applicato ad una X che può diventare stazionaria in media se su di essa dovesse essere applicato un
t
operatore differenza; tale modello viene definito come ARIMA (p,d,q).
Le fasi per la costruzione di un modello Arima
1. Verifica della stazionarietà
Si va a verificare tale condizione con riguardo sia alla varianza che alla media. Una serie storica è
stazionaria in media quando non presenta un cambiamento sistematico nella media; nel caso in cui non lo
sia, si può procedere alla rimozione della non stazionarietà per mezzo delle differenze successive di X . Una
t
serie storica è stazionaria in varianza se presenta una varianza costante nell’intervallo di tempo considerato;
nel caso di non stazionarietà ci troviamo in una situazione di eteroschedasticità, la quale può essere rilevata
con appositi test come il Test F.
2. Fase di identificazione del modello: metodo delle autocorrelazioni
Si vuole definire il numero e la natura dei parametri da includere nel modello, questo obiettivo può essere
raggiunto attraverso il cosiddetto metodo delle autocorrelazioni: quest’ultimo perviene all’individuazione delle
componenti (AR o MA) e dell’ordine del processo (p e q) attraverso un confronto tra gli andamenti teorici e
campionari delle funzioni di autocorrelazione. Queste funzioni possono essere globali o parziali al lag k.
3. Fase di stima dei parametri del modello
Viene utilizzato il metodo delle massima verosimiglianza il quale opera sotto l’ipotesi che la serie in esame
sia la realizzazione di un processo gaussiano stazionario.
4. Fase di verifica del modello
Vengono analizzati i residui i quali devono avere le seguenti caratteristiche: assenza di autocorrelazione e di
eteroschedasticità. I coefficienti