Che materia stai cercando?

Anteprima

ESTRATTO DOCUMENTO

I seguenti contenuti sono mie personali rielaborazioni di appunti presi a lezione e di ricerche

personali, sono quindi frutto di studio autonomo e non sono pertanto attribuibili in alcun

modo al docente titolare della cattedra né tanto meno all’università La Sapienza di Roma.

L’indicazione del nome del docente è inserito al solo fine di agevolare l’organizzazione e la

ricerca degli appunti sulla piattaforma Skuola.net.

P 5

RIMA PARTE

1. I 6

NTRODUZIONE

1.1 Significato dell’econometria ............................................................................................

6

1.2 Gli obiettivi dell’econometria ..........................................................................................

7

2. I 8

L MODELLO LINEARE

2.1 Il modello lineare - Un esempio .......................................................................................

8

2.2 I modelli e il lungo periodo ..............................................................................................

11

2.2.1 Modelli statici e modelli dinamici ........................................................................................................

11

2.2.2 Il saggio costante di crescita o di decrescita ........................................................................................

11

2.2.3 La tendenza di lungo periodo come modello semilogaritmico ...........................................................

12

2.2.4 Approssimazione del saggio di crescita ..............................................................................................

13

2.3 Prime caratteri delle serie storiche: tendenza, stagionalità e ciclo ...................................

14

2.4 La stima dei minimi quadrati (OLS) della tendenza lineare ............................................

15

2.4 Approssimazione - Numero di cifre decimali ..................................................................

18

2.5 I modelli econometrici .....................................................................................................

18

2.6 I residui da un punto di vista matematico ........................................................................

18

2.7 Il breve ed il lungo periodo - Un esempio .......................................................................

20

2.8 La stima dei minimi quadrati nel modello lineare semplice ...........................................

22

2.8.1 Determinazione dei parametri ..............................................................................................................

22

2.8.2 Interpretazione statistica .......................................................................................................................

23

2.9 Il grado di adattamento di un modello al campione dei dati ............................................

24

2.9.1 Scomposizione della devianza e coefficiente di determinazione centrato ...........................................

24

2.9.2 Coefficiente di determinazione non centrato .......................................................................................

25

2.9.3 Considerazioni sul coefficiente di determinazione ..............................................................................

26

2.9.4 Eliminazione della tendenza lineare con una differenza prima ............................................................

27

2.9.5 Stima di una funzione - Esempio .........................................................................................................

27

2.9.6 Il coefficiente di determinazione e scelta del modello .........................................................................

28

2.10 Omogeneità dei dati .......................................................................................................

28

2.11 La non linearità rispetto alle variabili ............................................................................

29

2.12 Propensione media ed elasticità .....................................................................................

30

2.12.1 La legge di Okun - Esempio ...............................................................................................................

30

2.12.2 Relazione fra tasso di cambio nominale e prezzi relativi ...................................................................

31

2.13 Le varie tipologie di dati - Serie storiche, dati sezionali e longitudinali .......................

31

3. L’ 33

AMBIENTE STOCASTICO

3.1 I residui come enti aleatori - Le ipotesi deboli ................................................................

33

3.2 Definizioni e risultati nell’approccio stocastico ..............................................................

35

3.3 Stime e stimatori dei minimi quadrati ..............................................................................

37

3.4 Il teorema di Gauss - Markov ..........................................................................................

38

3.5 La correlazione tra le variabili e tra gli stimatori dei parametri .......................................

38

3.6 Le ipotesi forti sui residui ................................................................................................

39

3.7 Gli intervalli di confidenza ..............................................................................................

40

3.8 La standardizzazione dell’intervallo di confidenza .........................................................

41

3.9 Residui normali ................................................................................................................

42

3.10 Inferenza statistica per i parametri del modello linee semplice .....................................

43

3.11 Verifiche d’ipotesi ..........................................................................................................

44

3.12 Errore di prima specie e errore di seconda specie ..........................................................

46

3.13 Inferenza statistica per la varianza dei residui ...............................................................

46

3.13.1 Stima puntuale di σ2 dei residui .........................................................................................................

46

3.13.2 Stima intervallare di σ2 dei residui ....................................................................................................

46

3.13.3 Verifica d’ipotesi lineari semplici per σ2 dei residui .........................................................................

47

3.13.4 Altre considerazioni di carattere statistico ed economico ..................................................................

48

3.13.5 Inferenza statistica per i parametri del modello lineare semplice con σ2 ignoto ...............................

48

3.14 Considerazioni finali sulla stima dei parametri e sugli intervalli di confidenza ............

49

3.15 Le principali distribuzioni statistiche in econometria ....................................................

50

3.15.1 La distribuzione Normale ...................................................................................................................

50

3.15.2 Distribuzione del Chi Quadrato .........................................................................................................

51

3.15.3 Distribuzione della t di Student ..........................................................................................................

52

3.15.4 Distribuzione della F di Fisher ...........................................................................................................

52

4. L 54

A PROIEZIONE

4.1 Proiezione e proiettore nei modelli lineari .......................................................................

54

4.2 L’errore di proiezione .......................................................................................................

56

4.3 Proiezione ex ante o ex post .............................................................................................

57

4.4 La proiezione con criterio dei minimi quadrati ................................................................

57

4.5 L’errore quadratico medio di proiezione ..........................................................................

58

4.6 Intervalli di confidenza per le proiezioni .........................................................................

58

4.7 Indicatori dell’accuratezza delle proiezioni ....................................................................

59

5. 61

LA MALASPECIFICAZIONE

5.1 Aspetti variegati della malaspecificazione .......................................................................

61

5.2 Eteroschedasticità dei residui ...........................................................................................

61

5.2.1 Il problema dell’eteroschedasticità e risoluzione .................................................................................

61

5.2.2 I test di omoschedasticità .....................................................................................................................

63

5.2.3 La formulazione di Koenker ...............................................................................................................

65

5.2.4 La correzione per l’eteroschedasticità di White ...................................................................................

65

5.3 Fonti e conseguenze dell’autocorrelazione ......................................................................

66

5.3.1 Il problema dell’autocorrelazione ........................................................................................................

66

5.3.2 Test di autocorrelazione dei residui ......................................................................................................

66

5.3.3 Il trattamento dell’autocorrelazione di ordine uno ...............................................................................

69

5.4 Il cambiamento strutturale per il modello semplice (Test del Chow) ..............................

71

5.5 Ipotesi forte sui residui (il test di normalità di Jarque Bera) ............................................

75

S 77

ECONDA PARTE

1. I 78

NTRODUZIONE AL MODELLO LINEARE MULTIPLO

1.1 I vettori e le moltiplicazioni righe per colonne ................................................................

78

1.2 Il modello lineare .............................................................................................................

79

1.3 L’impostazione matriciale in termini più analitici ...........................................................

79

1.4 Il criterio dei minimi quadrati ..........................................................................................

80

6.7 Il Coefficiente di determinazione corretto .......................................................................

82

2. L 83

E VARIABILI DI COMODO

2.1 Le variabili di comodo per il problema dell’omogeneità dei campione - Il termine noto ......

83

2.2 Le variabili di comodo per l'eliminazione delle osservazioni anomale ...........................

85

2.3 Variabili di comodo stagionali .........................................................................................

86

2.3.1 La depurazione stagionale con il criterio dei minimi quadrati .............................................................

87

2.3.2 La conservazione dei volumi ...............................................................................................................

88

2.3.3 Stagionalità additiva e moltiplicativa ...................................................................................................

88

3. I 90

L CAMBIAMENTO STRUTTURALE PER IL MODELLO MULTIPLO

3.1 Test del cambiamento strutturale per il modello lineare semplice ...................................

90

3.2 Test del cambiamento strutturale per il modello lineare multiplo ....................................

90

4. P 91

ROIEZIONE DEI MINIMI QUADRATI NEL CASO MULTIPLO

4.1 La proiezione ...................................................................................................................

91

5. G 92

LI SCHEMI DI AGGIUSTAMENTO

5.1 Gli schemi di aggiustamento ............................................................................................

92

5.2 Meccanismo di aggiustamento parziale (PAM) ...............................................................

93

5.3 L’aggiustamento con correzione del divario ....................................................................

95

6. L 97

A COSTRUZIONE ECONOMETRICA DEL MODELLO

6.1 La tendenza deterministica e la tendenza stocastica .......................................................

97

6.1.1 La tendenza deterministica ..................................................................................................................

97

6.1.2 La tendenza stocastica ..........................................................................................................................

98

6.1.3 Tendenza mista .....................................................................................................................................

98

6.1.4 La passeggiata aleatoria ......................................................................................................................

99

6.2 La cointegrazione .............................................................................................................

99

6.2.1 La cointegrazione - Introduzione .........................................................................................................

99

6.2.2 La verifica della tendenza stocastica test di Dickey e Fuller ...............................................................

101

6.2.3 La verifica della cointegrazione ...........................................................................................................

102

P RIMA PARTE

La regressione univariata

1. I NTRODUZIONE

1.1 Significato dell’econometria

L’econometria è una scienza interdisciplinare che ha il fine ultimo di studiare i processi economici

utilizzando metodi matematici e metodi statistici. A dimostrazione di questo consideriamo

immediatamente un esempio: c = µ + βy

dove c e y sono le variabili;

µ e β sono i parametri che sono stimati con serie numeriche fornite dalle istituzioni

statistiche.

Questa equazione indica la relazione che esiste fra reddito (y) e consumo (c) formulata per la prima

volta da J. M. Keynes (1936) e dalla quale si evincono degli elementi di economia (ovvero la

relazione fra consumo e reddito inteso in senso generale), elementi di matematica (si tratta infatti di

una relazione lineare) e elementi di statistica (che risiedono nella necessità di stimare i parametri µ e

β). Tuttavia spesso la sola teoria economica non è capace di sviluppare ipotesi compiute e spesso le

sue indicazioni sono solo un punto di partenza. Per meglio comprendere quanto detto poniamoci le

seguenti domande: La relazione data è vera di per sé?; La variabile y (reddito) deve essere

ritardata di un certo lag affinché la relazione sia vera?; ed infine La forma matematica è

effettivamente lineare oppure no?.

Dare una risposta a tutte queste domande non è sempre agevole ed è proprio l’econometria che ci

aiuta in tale obiettivo: essa parte da una relazione teorica, come quella prima illustrata, e sulla base

ti

dei dati statistici forniti da diverse istituzioni (ISTAT, EUROSTAT e così via) dà indicazioni su

o

1

come completare la relazione anche se questo non è sempre possibile . In altri termini possiamo dire

un at

che l’econometria non è un semplice strumento della teoria economica utilizzato per applicare i dati

ma è essa stessa produttrice di teorie economiche; e non è un semplice strumento di verifica

rb

pp

empirica effettuata per scegliere fra ipotesi alternative ma è essa stessa produttrice di ipotesi da

valutare di cui verificare la consistenza con la realtà. La conseguenza di queste argomentazioni è

Ba

di

A

che si sviluppa un’analisi econometria composta da fasi di speculazione economica teorica e da fasi

di indagine empirica, fasi queste non separabili ma fortemente integrate fra loro.

la

L’econometrico ha spesso a che fare con relazioni simili a quella vista prima ed in particolare nel

corso di questa trattazione faremo riferimento quelle di tipo lineare o linearizzabili ovvero relazioni

ue

che in primis sono no lineari ma possono essere facilmente rese tali attraverso alcune rielaborazioni.

an

In alcuni casi la relazione proposta in termini teorici dagli econometrici non è valida quindi sono gli stessi

1 Em

che, essendo dei teorici economici, devono modificare le specificazioni teoriche dell’equazione da stimare in

modo tale che la nuova formulazione sia più consona ai dati. Da questo si evince che è lo stesso

econometrico che fa teoria economica.

Questo paradigma è divenuto sempre più importane nel corso del tempo, infatti molte formulazioni teoriche

del passato oggi non sono più valide e necessitano di un’attenta revisione (vedi ad esempio i tassi di interesse

negativi)

L’econometria presenta diversi campi specifici di applicazione ad esempio l’econometria finanziaria

ovvero l’utilizzazione della modellistica econometrica e delle analisi econometriche all’ambito

finanziario; altri esempi sono la microeconometria (ovvero l’econometria applicata a problemi di

carattere microeconomico e aziendale) e la macroeconometria (ovvero l’econometria applicata a

problemi di carattere macroeconomico riferiti ad esempio l’attività economica di un paese, alle

impostazioni, alle esportazioni e via dicendo).

1.2 Gli obiettivi dell’econometria

I principali obiettivi che l’econometria tenta di perseguire sono i seguenti:

i) Lo studio empirico di ipotesi economiche determinate dalla teoria economica o prodotte dalla

stessa econometria. Questo implica il confronto fra queste ipotesi (ad esempio possiamo

utilizzare strumenti econometrici per confrontare le conseguenze delle diverse scuole di

pensiero economiche sulla base dei dati);

ii) Analisi e sintesi delle caratteristiche dei fenomeni economici di cui si posseggono dei dati (ad

esempio analisi della domanda, analisi analisi del ciclo del prodotto e così via);

iii) Sintesi descrittiva delle caratteristiche di fenomeni economici sulla base di una teoria o sulla

base dei dati osservati. In tale ambito si può fare uso di discipline molto particolari come ad

esempio l'analisi delle serie storiche o l’analisi della congiuntura, infatti oggi si dà molto peso

allo studio dell'econometria dinamica (studio delle serie storiche);

iv) Costruzione di modelli formali che rappresentano la realtà economica a vari livelli di

aggregazione per settori più o meno specifici e per ripartizioni geografiche più o meno ampie;

v) Utilizzo dell’econometria per:

L’analisi strutturale ovvero quella relativa ad esempio alla determinazione dell’elasticità o

delle propensioni marginali o medi; ti o

La valutazione delle politiche economiche effettivamente realizzate e l’analisi delle strategie

un at

alternative sulla base di simulazioni dinamiche economiche diverse

La previsione dell’andamento temporale di variabili economiche ed aziendali.

rb

pp Ba

di

A la

ue

an

Em

2. I L MODELLO LINEARE

2.1 Il modello lineare - Un esempio

Il modello lineare consente di individuare una relazione che lega una variabile, ad esempio il

consumo, ad un altra variabile (o ad altre variabili), ad esempio il reddito. Per meglio comprendere

come funziona tale modello partiamo dalla relazione che lega consumo e reddito già vista nel

capitolo introduttivo: c = µ + βy = ƒ(y)

Le principali caratteristiche di questa relazione, che meritano di essere commentate sono le

seguenti:

i) La relazione è lineare - L’equazione data è lineare sia nei parametri che nelle variabili (doppia

linearità): c è lineare rispetto alle variabili 1 (variabile costantemente pari a 1 che moltiplica µ)

e y (che moltiplica β) secondo i parametri µ e β anch’essi lineari. Se le variabili fossero non

lineari generalmente è possibile linearizzare la relazione, al contrario se non vi è linearità nei

parametri linearizzare la relazione rispetto ai parametri è più complesso e alle volte impossibile.

In questi casi con le tecniche di analisi numerica moderna e con l’uso dei computer, si possono

fare delle approssimazioni molto buone;

ii) La funzione ƒ(y) è stabile nel tempo - La stabilità indica che questa relazione rimane tale nella

sua specificazione e nei valori stimati di µ e β nel tempo, questa caratteristica è di notevole

1

importanza in quanto permette di considerare valida in media la relazione per periodi di tempo

relativamente lunghi. Va tuttavia sottolineato che in questo caso specifico la relazione è stabile

fino ad un certo punto, infatti, β (che ad un punto di vista economico rappresenta la propensione

2

marginale al consumo) è un parametro che si modifica nel tempo , quindi si fa fatica a

ti o

considerare il modello come un modello stabile nel tempo (la stabilità della relazione dipende

un at

allora dall’orizzonte temporale che si considera). Un altro tipo di stabilità è quella relativa al

campione; rb

pp

iii) L’intercetta della relazione, µ, è generalmente positiva visto che anche a reddito zero vi è un

Ba

minimo consumo legato ad esigenze primarie. Da un punto di vista matematico µ rappresenta il

di

A

termine noto della relazione o l’intercetta di c con l’asse x;

iv) Il parametro β cioè la propensione marginale al consumo è positivo ma inferiore all’unità (e

la

3

sarà prossimo all’unità quando il risparmio è prossimo a zero ) e rappresenta il coefficiente

ue

La relazione deve essere considerata valida in media poiché da un periodo all’altro vi possono essere delle

1

leggere discrepanze fra il membro di destra e il membro di sinistra.

an

Alcuni concetti sono validi subordinatamente a tutta una serie di assunzioni: ad esempio tornando al

2 Em

discorso relativo alla propensione marginale al consumo possiamo dire che questa in passato era

particolarmente bassa in Italia (il risparmio era più elevato) a differenza di quanto avviene attualmente.

Importante è notare che alcune assunzioni fatte nel lungo periodo non sono più valide nel breve periodo e

ancora meno nel brevissimo periodo.

Ad esempio negli Stati Uniti la propensione marginale al consumo è prossima allo zero, mentre in Italia si

3

aggira intorno allo 0,90 (contro lo 0,80 degli anni 15 - 20).

angolare della retta ovvero la pendenza retta. Da un punto di vista prettamente matematico

possiamo vedere β come la derivata di ƒ(y) rispetto ad y, mentre la propensione media al

consumo è il semplice rapporto fra il consumo e il reddito. Va notato che la propensione

marginale è inferiore alla propensione media.

Un passo avanti, relativamente alla precedente equazione, può essere compiuto considerando

l’imposizione (ν) e quindi il reddito disponibile:

d

y = y - ν

c = µ + β(y - ν)

Si nota allora che c non è più funzione lineare del reddito, ma del reddito disponibile in quanto un

esame, seppur semplificato, del comportamento dei consumatori può indurre a ritenere che essi

basino le decisioni di spesa sulla quantità di reddito che hanno effettivamente a disposizione una

volta detratte le imposte. In questo caso allora le variabili sono il consumo (c) il reddito (y) e

4

l’imposizione (ν) , mentre i parametri vanno stimati sotto il vincolo che il coefficiente di y e di ν

siano uguali e pari a β (stima vincolata).

Come si diceva nel paragrafo 1.1 l’econometrico riprende dall’economia le relazioni in maniera

“grossolana” (in questo caso considera l relazione c = µ + βy) per poi affinarle e modificarle a

seconda delle esigenze. Le relazioni viste finora sono delle relazioni statiche in quanto legano le

variabili c, y e ν allo stesso tempo, ma l’econometrico, sempre congetturando in termini di teoria

economica, può presumere che il consumo al tempo t si funzione del reddito goduto in tempi

precedenti. Ne sono esempi le seguenti relazioni:

c = µ + βy

t t-1 ti

5

dove il reddito è funzione lineare del reddito ritardato di un lag ; o

un at

c = µ + β y + β y + β y

t 0 t 1 t-1 2 t-2 rb

pp

dove la variabile y sussiste sia al tempo corrente che a quello ritardato di una e due unità temporali.

Ba

di

A

c = µ + β y + β y + … + β y

t 0 t 1 t-1 k t-k

la

dove la variabile y sussiste sia al tempo corrente sia a quello ritardato fino a k lag.

Tuttavia in quest’ultimo caso sorge un dissidio fra aspetti teorici e aspetti empirici dell’analisi

ue

dovuto al fatto che il numero di ritardi k, pur essendo semplice da determinare in termini empirici è

difficile da giustificare in termini teorici. Questa relazione ha quindi un aspetto di arbitrarietà

an

Em

Nota che le variabili esplicative non sono più due (1 e y) ma tre (1, y e ν).

4 Nota che l’unità temporale dipende dal periodo di riferimento del consumo che può essere trimestrale (in

5

questo caso prendo il reddito ritardato di un trimestre), mensile (in questo caso prendo il reddito ritardato di

un mese) e così via. Le considerazioni circa i ritardi non possono essere fatte sulla base di elementi

prettamente teorici ma devono far riferimento ai dati che si hanno a disposizione di modo da valutare qual è

la relazione economica che sia adatta meglio ai dati.

(numero di ritardi k) che risulta difficilmente conciliabile con le esigenze di generalità dell’analisi

teorica. Tale dissidio può essere risolto se generalizziamo la precedente relazione fino a considerare

infiniti ritardi temporali ottenendo così lo schema a ritardi distribuiti infiniti:

c = µ + β y + β y + β y + …

t 0 t 1 t-1 2 t-2

Da un punto di vista economico tale relazione non è valida a meno che si possa dire che il consumo

è funzione di tutta la storia passata del reddito con fattori di proporzionalità β decrescenti

j

all’aumentare della lontananza nel tempo. D’altra parte tale relazione appare molto interessante dal

punto di vista matematico in quanto tale schema può essere trasformato in modo da ridurre il

6

numero infinito di parametri da stimare ed ottenere così una relazione molto parsimoniosa.

j

Ipotizziamo quindi che β = βρ con 0 < ρ < 1 e sostituendolo alla relazione precedente si ottiene:

j 2

c = µ + βy + βρy + βρ y + …

t t t-1 t-2

Ritardiamo questa relazione di un lag e moltiplichiamola per ρ:

2

c = µ + βy + βρy + βρ y + …

t-1 t-1 t-2 t-3

2 3

ρc = ρµ + βρy + βρ y + βρ y + …

t-1 t-1 t-2 t-3

Ora sottraiamo la seconda relazione dalla prima:

2 2 3

c - ρc = µ + βy + βρy + βρ y + … - ρµ - βρy - βρ y - βρ y - …

t t-1 t t-1 t-2 t-1 t-2 t-3

c - ρc = (1 - ρ)µ + βy

t t-1 t

c = µ’ + ρc + βy

t t-1 t

dove µ’ = (1 + ρ)µ. ti o

un

Si è trasformata quindi una relazione con infiniti parametri da stimare in una relazione con soli tre

at

j 7

parametri µ, β e ρ. Dunque, sotto l’ipotesi che β = βρ , i due modelli sono equivalenti sebbene il

j rb

pp

secondo sia ben più parsimonioso del primo. Ba

di

In relazione a questo schema vanno fatte delle considerazioni economiche:

A

j

i) La quantità ρ (essendo ρ compreso fra zero e l’unità), al crescere di j, diviene sempre più

la

piccola il che comporta una riduzione progressiva dei coefficienti β fino a quasi azzerarsi

(saranno infatti pari a zero per j → ∞). Queste considerazioni sono generalmente vere in

ue

economia: l’impatto di una variabile su un’altra e sempre più fievole man mano che scorre il

tempo. Tuttavia va detto che vi sono dei casi in cui l’impatto di una variabile su un’altra è molto

an

Em

Tale stima è sicuramente impossibile visto che il numero di dati a disposizione dell’econometrico è finito.

6 Molto spesso nei libri di testo si hanno relazioni statiche come quella illustrata anche se la realtà economica

7

è dinamica. Tali relazioni sono infatti costruite attraverso l’ipotesi appena enunciata che permette di

trasformare un modello dinamico in un modello statico.

scarso all’inizio (al tempo t), comincia ad aumentare successivamente (ai tempi t - 1, t -2 e così

8

via) per poi ridursi nuovamente .

ii) In secondo luogo, relativamente al risultato, va detto che la quasi differenza che si ottiene

(ovvero c - ρc ) è funzione di una variabile y allo stesso tempo t. Abbiamo allora trasformato

t t-1

un modello dinamico, ovvero un modello con variabili ritardate, in un modello statico e questo

dà importanza a tutte le analisi che sono fatte in termini contemporanei.

All’interno della teoria, a questo punto, è difficile, per non dire impossibile, determinare quale sia la

relazione migliore, tra quelle esposte, in termini di adeguatezza della rappresentazione del

funzionamento reale del sistema economico: per effettuare una scelta razionale è necessario

esaminare la realtà empirica (con metodi descrittivi e statistici). In questo modo si passa allora

dall’analisi economica all’analisi econometrica che ha l’obiettivo di stimare i parametri e di

valutarli secondo un criterio di ottimo prestabilito.

2.2 I modelli e il lungo periodo

2.2.1 Modelli statici e modelli dinamici

Questi modelli sono rappresentazioni formali ed idealizzate delle caratteristiche, dette anche fatti

9

stilizzati , osservate di regolarità e di stabilità dei fenomeni economici sotto studio e vengono

specificati in base al processo interattivo di speculazione teorica e di indagine empirica visto il

paragrafo 1.1.

I modelli prima illustrati possono essere distinti in modelli statici ovvero quei modelli in cui

intervengono solo variabili correnti (associate al tempo t); e modelli dinamici ovvero quei modelli

in cui intervengono solo variabili correnti e variabili ritardate di una o più unità temporali.

Poiché i fenomeni economici si evolvono nel tempo, i modelli dinamici hanno una rilevanza ben più

grande di quelli statici, ma occorre tener presente che questi ultimi possono sovente essere

considerati come rappresentativi dei sentieri di equilibrio di lungo periodo dei modelli dinamici.

ti o

un

2.2.2 Il saggio costante di crescita o di decrescita at

rb

pp

10

Il saggio di crescita , che può riguardare una qualsiasi variabile economica, è generalmente

indicato con γ ed indica il rapporto fra la variabile considerata al tempo t e la stessa variabile al

Ba

di

tempo precedente al quale sottraggo uno:

A la

ue

Ad esempio l’aumento della quantità di moneta comporta degli effetti dilazionati nel tempo ovvero non si

8

hanno nel breve periodo. Per questa ragione operazioni di economia monetaria non possono essere

an

rappresentate con lo schema illustrato. Em

Il modello economico riguarda sempre la media: ad esempio l’aumento medio del reddito comporta

9

l’aumento medio del consumo, non si può dire infatti che ad un certo aumento di reddito corrisponde un

certo aumento del consumo. Questo deriva dal fatto che gli eventi sono bombardati da una serie di fatti che li

modificano quindi solo in media l’andamento è prevedibile.

La definizione di tasso di decrescita o tasso di crescita negativo è del tutto identica a quella data con

10

l’accortezza che questa avrà segno negativo.

Supponiamo a questo punto di voler considerare la funzione che lega il consumo al tempo t e il

reddito al tempo t-1: c = µ + βy

t t-1 11

e se vale l’assunzione di saggio costante γ per unità di tempo per il reddito, ovvero se y = (1 +

t

γ)y , allora il modello originario si trasforma in un modello nel quale la variabile considerata è pari

t-1

ad una costante, oppure ad una funzione che considera altre variabili riferite allo stesso tempo di

12

y .

Consideriamo ad esempio due variabili qualsiasi e supponiamo che la relazione fra queste sia la

seguente: y = µ’ + ρy + βx

t t-1 t

e consideriamo che y abbia un saggio marginale di crescita costante e pari a γ ovvero y = (1 + γ)y ,

t t-1

il modello che ne risulta è il seguente:

Quello ottenuto è un modello del tutto analogo ad un modello statico quindi può essere visto come

la relazione di equilibrio di lungo periodo tra le due variabili nel caso in cui il modello di breve

periodo sia y = µ’ + ρy + βx mentre il comportamento di lungo periodo relativo alla variabile y

t t-1 t-1

sia y = (1 + γ)y .

t t-1

Facciamo ora delle considerazioni sull’operazione di ritardo: se applico un certo operatore L (lag)

ad una variabile ottengo la stessa ritardata di un unità temporale (che può essere un anno, un mese,

13

una settimana, un giorno e così via). Questa operazione è quindi tipica del calcolo discreto , nel

ti

caso continuo, invece si fa riferimento alla derivata. o

un at

2.2.3 La tendenza di lungo periodo come modello semilogaritmico rb

pp

Supponiamo che una certa variabile si muova con un certo saggio di crescita γ ovvero:

Ba

di

A

y = (1 + γ)y

t t-1 la

Da questo deriva che se γ > 0 (γ < 0) il sentiero di evoluzione di lungo periodo della variabile

considerata è di crescita (di decrescita). Se supponiamo che t = 1, 2, 3 … avremo le seguenti

ue

relazioni: an

Questo rappresenta un fatto stilizzato: se consideriamo un arco temporale molto lungo possiamo prendere

11

il valor medio e considerare un valore costante di γ. In altre parole il consumo aumenta (γ > 0) o diminuisce

Em

in ogni unità temporale e questa proporzione è data proprio da γ.

(se γ < 0) di una proporzione di y

t-1

La stessa cosa può essere scritta dicendo che y = y = γy oppure con Δy = γy , dove l’operatore Δ

12 t t-1 t-1 t t-1

opera su y e lo trasforma nella differenza di questo e della stessa variabile ritardata di un periodo.

t

Generalmente in economia si parla in termini discreti quindi bisognerebbe sviluppare una teoria

13

nell’ambito del tempo discreto analoga alla teoria sviluppata nel continuo.

y = (1 + γ)y

1 0 2

y = (1 + γ)y = (1 + γ) y

2 1 0

3

y = (1 + γ)y = (1 + γ) y

3 3 0

… t

y = (1 + γ) y

t 0

dove y è una costante e rappresenta il valore che la variabile assume all’origine dei tempi ovvero

0

quando t = 0. Essa rappresenta quindi una condizione iniziale al di fuori della serie storica

costituita dalle osservazioni disponibili.

In questo modo, risolvendo un’equazione differenziale, abbiamo espresso la variabile y con una

t

funzione del tempo; tale funzione viene detta equazione alle differenze finite.

Questa relazione può essere scritta considerando il logaritmo di entrambi i membri:

t

ln(y ) = ln[(1 + γ) y ]

t 0

ln(y ) = tln(1 + γ) + ln(y )

t 0

ln(y ) = µ + βt

t

14

dove µ = ln(y ) e β = ln(1 + γ) .

0

Quello ottenuto è il modello semilogaritmico in quanto si esprime una variabile logaritmizzata in

t

funzione di una non trasformata (t). La relazione ottenuta corrisponde esattamente a y = (1 + γ) y e

t 0

costituisce un esempio di forma non lineare nelle variabili.

Un’ulteriore caratteristica del modello semilogaritmico risiede nel fatto che questo può essere

15

utilizzato per andare a rappresentare la tendenza di una variabile : se il tempo aumenta, a seconda

del segno di µ e β, il logaritmo della variabile a sinistra aumenta o diminuisce.

2.2.4 Approssimazione del saggio di crescita ti

Il saggio di crescita γ è pari alla seguente relazione: o

un at

rb

pp

dove x è una generica variabile. Ba

di

Questo viene di solito approssimato considerando la differenza logaritmica:

A

Δlnx = lnx - lnx

t t t-1 la

dove Δ denota la differenza prima (spesso indicata con ẋ ).

t ue

Queste due versioni del tasso di crescita γ sono quasi equivalenti e per dimostrare questo seguiamo

an

il seguente procedimento: Em

Dimostrazione

Da questo deriva che γ = e - 1.

14 β

La tendenza di una variabile, che è un fatto stilizzato di lungo periodo, è quel sentiero che questa ha in un

15

certo intervallo temporale. Questa può essere quindi crescente o decrescente.

Per la dimostrazione consideriamo l’espansione in serie di Taylor della funzione ln(1 + γ):

Sostituiamo ora a γ la relazione vista prima e otteniamo:

Ma il logaritmo del rapporto è pari alla differenza dei logaritmi, quindi abbiamo:

Da questo ricaviamo che la differenza logaritmica è maggiore rispetto al saggio di crescita poiché

sarà pari a questo più dei termini infinitesimali i quali sono tanto più piccoli quanto minore è γ.

Possiamo dire allora che quest’approssimazione è buona per valori piccoli di γ (dallo 0% al 6%)

mentre è peggiore per tassi di crescita più elevati. Ciò che spinge a procedere con questa

approssimazione è il fatto che basta considerare la differenza logaritmica per ottenere

un’approssimazione percentuale.

2.3 Prime caratteri delle serie storiche: tendenza, stagionalità e ciclo 16

La maggior parte dei dati economici sono spesso riportati in termini di serie storiche quindi è

fondamentale commentare i fatti stilizzati, o caratteristiche, di questi:

i) La tendenza - La tendenza fa riferimento all’andamento della serie la quale può costantemente

crescere o decrescere nel tempo. Il trend può avere una forma lineare, quadratica, cubica,

esponenziale e così via;

ii) La ciclicità - Nel caso in cui si parli di serie storiche con dati economici, la ciclicità rappresenta

ti

le fasi di espansione e le fasi di recessione dell’economia (ciclo economico); o

un at

iii) La stagionalità - Nelle serie storiche con frequenza infrannuale (mensili, trimestrali e così via)

esistono andamenti che si ripetono similmente nei tempi e nelle dimensioni anno dopo anno.

rb

pp

Esempi relativi alla stagionalità fanno riferimento alla vendita di un certo bene, alla riduzione

della produzione che si ha ogni anno nel mese di Agosto, aumento dei prezzi nel mese di

Ba

di

A 17

Settembre, aumento dei depositi bancari a fine anno o alla fine di ogni trimestre (in relazione

alla liquidazione degli interessi). La componente stagionale è particolarmente “fastidiosa”

18

quando si devono effettuare delle stime o quando si effettua l’analisi congiunturale il che porta

la

a delle tecniche mirate all’eliminazione della stagionalità. In generale, per i motivi appena

ue

an

In econometria si studiano sostanzialmente fatti stilizzati che conformano l’andamento dell’economia nel

16 Em

tempo.

Generalmente le banche trattengono, verso la fine anno, la maggior parte dei depositi in quanto

17

l’ammontare di questi viene utilizzato per valutare le banche al 31 dicembre di ogni anno.

Analisi economica di brevissimo periodo che studia le variazioni di alcune variabili economiche da un

18

mese ad un’altro, tale analisi è quindi fortemente influenzata dalle stagionalità 19

esposti i produttori di dati, come l’ISTAT, producono serie storiche destagionalizzate . In

alcuni casi particolari si preferisce mantenere questa componente poiché la sua eliminazione

comporta delle distorsione.

La Figura 2.3. illustra un esempio di ciclo economico.

Figura 2.3.1 Dal grafico si nota che una volta terminata la fase di recessione, una volta raggiunto il unto di minimo

locale, ha inizio la fase di ripresa alla quale segue la fase di espansione. Queste fasi non possono essere considerate

simmetriche infatti generalmente si nota che le fasi di recessione sono più ripide di quelle di espansione: nel punto di

svolta inferiore ci si arriva velocemente mentre la fase di espansione avviene lentamente (asimmetria del ciclo

economico). In particolare la Figura rappresenta l’andamento del prodotto interno lordo in Italia dal 1970 al 2000. In

grigio sono evidenziate le importanti recessioni come quella avvenuta intorno al 1973 - 1974 in corrispondenza della

prima crisi petrolifera.

2.4 La stima dei minimi quadrati (OLS) della tendenza lineare

All’inizio di questo capitolo abbiamo riportato una relazione lineare fra consumo e reddito:

ti

c = µ + βy o

un at

Tale relazione è utilizzabile per diversi casi, ad esempio si potrebbe studiare la variazione del

rb

pp

consumo con il tempo quindi al posto della variabile y avremo la variabile t, quindi in generale

20

parliamo di una variabile x esplicativa e di una variabile y variabile dipendente e funzione di x:

Ba

di

A

y = µ + βx la

In tutte le relazioni viste abbiamo dei parametri, µ e β, i quali vanno stimati a partire da un

campione di dati, con l’utilizzo del metodo dei minimi quadrati. Tale metodo è di semplice è di

ue

semplice illustrazione quando i parametri appaiono in un’equazione lineare non solo rispetto a

questi ma anche rispetto alle variabili. an

Em

In ogni caso è disponibile anche una serie non destagionalizzata in quanto si lascia all’analista la facoltà di

19

scegliere se considerare la componente stagionale oppure no.

Il fatto di chiamarla variabile dipendente non è molto condivisibile in quanto l’aggettivo dipendente è

20

appropriato solo nel momento in cui ho una sola relazione: se il modello econometrico è costituito da diverse

relazione è probabile che la variabile dipendente di una relazione sia esplicativa in un’altra. Stessa cosa vale

con gli aggettivi esogena ed endogena.

I dati osservati possono essere rappresentati in un diagramma cartesiano costituendo così una

21

nuvola di punti interpolata nella maggior parte dei casi da una retta (y = µ + βx) che si modifica a

seconda del criterio utilizzato per determinare i parametri che la specificano. Tale retta ovviamente

non tocca tutti i punti, infatti qualcuno di questi rimane ad una distanza u generalmente non nulla

x

Figura 2.4.1). y y = µ + βx

x

Figura 2.4.1 - La figura illustra una nuvola di punti interpolata da una retta, la distanza che c’è tra i punti e la retta y = µ

+ βx è pari a u .

x

Da quanto detto si capisce che lo scopo di questo paragrafo è quello di illustrare un metodo che

consenta di stimare dei parametri µ e β che specificano una retta per la quale la distanza dei punti da

questo sia minima. Esistono differenti criteri per far questo e tra gli alti abbiamo:

ti o

i) Minimizzazione della somma delle distanze - Questo criterio non è sempre utilizzabile poiché le

un at

distanze potrebbero essere sia negative che positive quindi tenderebbero ad annullarsi. In questo

modo la somma potrebbe essere molto piccola anche in presenza di distanze molto grandi in

rb

pp

valore assoluto; Ba

ii) Minimizzazione della somma del valore assoluto delle distanze - Questo criterio permette di

di

A

eliminare l’inconveniente illustrato nel punto precedente, tuttavia da un punto di vista

matematica la minimizzazione di tale relazione è abbastanza complessa;

la

iii) Minimizzazione della somma dei quadrati delle distanze - Questo criterio è anche noto come

metodo dei minimi quadrati, esso possiede lo stesso vantaggio del metodo precedente e in più è

ue

di facile trattazione matematica (le derivate di un quadrato sono molto semplici da

determinare). Il metodo dei minimi quadrati ha delle implicazioni di carattere economico e

an

finanziario: utilizzando il quadrato delle distanze i valori positivi e negativi sono trattati alla

stessa stregua. La retta che costruiamo utilizza, quindi, un criterio per il quale le distanze

Em

positive hanno lo stesso valore di quelle negative; tuttavia, talvolta, questo non è vero infatti

molti soggetti (soprattutto quelli avversi al rischio) avvertono la perdita in maniera differente

dal guadagno.

Generalmente la retta rappresenta la tendenza dei dati che si posseggono e che vengono rappresentanti.

21

Esistono diversi altre metodologie per la determinazione delle stime di µ e β, ma il metodo dei

minimi quadrati è sicuramente quello più semplice da applicare, e tra l’altro le stime che si

ottengono con altri strumenti sono del tutto simili alle stime dei minimi quadrati.

Esempio - Supponiamo che la variabile x sia il tempo e la variabili y sia il logaritmo dei consumi

22

nominali in Italia espressi in milioni di euro. Otteniamo, utilizzando il metodo dei minimi quadrati

la seguente relazione ln(c ) = 13,248 + 0,129t

t

che può essere rappresentata come in Figura 2.4.2:

Figura 2.4.2 - Evoluzione del logaritmo dei consumi nominali in Italia

È noto che se il logaritmo di una certa variabile, i consumi nominali in questo caso, è

rappresentabile con una retta, la variabile stessa avrà un andamento esponenziale (Figura 2.4.3):

ti

13,448 + 0

c = e

t o

un at

rb

pp Ba

di

A la

ue

an

Figura 2.4.3 - Evoluzione dei consumi nominali in Italia Em

I consumi nominali sono ottenuti come prodotto fra i consumi reali e il deflettore dei consumi privati.

22

Variabili reali e variabili nominali

In economia è fondamentale la distinzione fra variabili reali e variabili nominali, ad esempio quando si parla di

prodotto interno lordo si sottintende PIL reale; quando invece si parla di debito pubblico e deficit e di tutti gli

indicatori ad essi connessi, come il rapporto fra Deficit e PIL oppure fra Debito e PIL, il prodotto interno lordo che si

considera è nominale; infine quando si parla di quantità di moneta si parla di una variabile nominale visto che

incorpora l’aumento dei prezzi di un paese e via dicendo.

Da quanto detto si evince che le variabili nominali considerano l’aumento dei prezzi invece quelle reali prescindono

da questo elemento.

Le variabili nominali possono essere ottenute semplicemente come prodotto fra le variabili reali e il livello dei prezzi,

da questo si evince che il saggio di crescita di una variabile nominale è pari alla somma del saggio di crescita della

variabile reale più il saggio di crescita dei prezzi:

2.4 Approssimazione - Numero di cifre decimali

Conviene sempre prestare attenzione al numero di cifre significative (diverse da zero) che

manteniamo nei calcoli. Un numero troppo grande rende farraginosa la scrittura ed è foriero di

errori di imputazione dei dati (ad esempio nei computer); un numero troppo piccolo può condurre

ad approssimazioni imprecise . Dal punto di vista statistica della significatività dei dati è difficile

che possano servire più di quattro cifre significative perché già con esse si ottiene

un’approssimazione inferiore al millesimo. Dal punto di vista economico, invece, già tre cifre

significative danno un’approssimazione inferiore al centesimo, più che sufficiente per ogni tipo di

analisi. I logaritmi sono molto sensibili ai decimali quindi si consiglia calcolarli con almeno cinque

cifre decimali.

Fondamentale è non andare sotto l’approssimazione centesimale.

ti o

un

2.5 I modelli econometrici at

rb

pp

Possiamo distinguere i modelli econometrici in grandi modelli econometrici (modelli costituiti da

differenti equazioni come quello utilizzato dalla Banca d’Italia) e piccoli modelli econometrici

Ba

di

A

(composti da circa 15 - 20 equazioni) che sono utili per analisi approssimative di quello che avviene

in certe economie o in analisi teoriche. Questo perché nei modelli gradi la teoria svanisce: se si

segue una data scuola di pensiero economica (monetarista, keynesiana ecc.) si devono costruire date

la

equazioni ed evitarne altre quindi in tali modelli non è possibile seguire una data corrente.

ue

2.6 I residui da un punto di vista matematico an

L’equazione che andremo a stimare con il metodo dei minimi quadrati illustrato nel paragrafo 2.4 è

del tipo: Em

y = µ + βx + u

t t t

dove u rappresenta semplicemente la differenza fra y e µ + βx , ovvero rappresenta la differenza fra

t t t

il valore effettivo, che è fornito dagli istituti di statistica come l’ISTAT, e il valore ottenuto

interpolando i dati (distanza fra l’ordinata effettiva - dati osservati - e l’ordinata stimata - dati teorici

- in corrispondenza della stessa ascissa).Tali differenze sono dovute al fatto che è difficile che il

dato osservato indicato dalla coppia (x , y ) coincida esattamente con il valore sulla retta stimata:

t t

esiste allora una corrispondenza fra un evento economico e rappresentazione analitica riferita alla

differenza fra i punti che derivano dal campione e quelli sulla retta.

In statistica tali differenze sono chiamate errori intendendosi per errore il fatto di aver sostituito ai

dati osservati altri valori da essi generalmente diversi. In realtà di sbaglio non si tratta in quanto

esiste sempre una motivazione economica relativa alla discrepanza fra dato osservato e dato teorico

corrispondente. Questa discrepanza ha, in econometria così come in economia applicata, tantissime

denominazioni: possiamo chiamarla disturbo (la relazione teorica rettilinea è disturbata in ogni

tempo da un qualcosa), possiamo chiamarla innovazione, possiamo chiamarla residuo e così via.

Quando la curva interpolante, nel nostro caso una retta, è definita lo sono anche i parametri quindi

^ ^

e β :

possiamo dire he vengono individuate le stime di µ e β indicate con µ

y^ ^ ^

y = µ + βx → Criterio di stima → = µ + β x

t t t t

u^

Per tale ragione anche i residui li indicheremo con e saranno pari a:

t u^ ^ ^

u = y - µ - βx → Criterio di stima → = y - µ - β x

t t t t t t

Importante è notare che se µ e β non sono definite precisamente con un dato criterio di stima allora

il residuo sarà generale, mentre una volta fissati i parametri (e quindi fissata una retta) potrò

individuare univocamente la distanza fra dati osservati e dati teorici.

u^

Le determinate numericamente possono essere considerate come stime delle u e quindi sono

t t

intesi come residui stimati. Dopo aver scelto il criterio di stima e dopo aver determinato il valore

stimato della variabile dipendente è utile passare ad una rappresentazione grafica dei residui stimati.

ti

Questo perché, da un parte, posso, semplicemente osservando questo grafico, capire se la

o

un

specificazione iniziale fatta dall’analista è corretta e dall’altra, trarre delle indicazioni di modifica

at

del modello utilizzato (Figura 2.6.1 e Figura 2.6.2).

23 rb

pp Ba

di

A la

ue

Figura 2.6.1 - Serie storica dei residui stimati relativi ai consumi (modello semilogaritmico) privati totali nominali in

Italia. an

Em

Ad esempio se uno dei residui è molto più distante dagli altri allora, generalmente, o il dato dell’istituzione

23

statistica è sbagliato; oppure sono errate le determinazioni dei parametri del modello.

Se l’errore è dell’istituto statistico, una procedura di correzione consiste nel considerare la media del dato

precedente e del dato successivo per sostituirla al dato errato, da notare è infatti che un singolo dato errato

può portare la stima ad essere molto lontana dalla realtà.

Figura 2.6.2 - Serie storica dei residui stimati relativi ai consumi privati nominali in Italia.

Quello che si nota dai grafici riportati è il fatto che i residui non sono distribuiti come White

Noise,esto perché questo perché le diverse relazioni spesso non considerano tutte le variabile

necessaria. Ad esempio nella relazione fra consumo e tempo andrebbero considerate le seguenti

variabili:

i) Tassi di interesse a breve - Molti soggetti si chiedono se è più conveniente consumare o

risparmiare acquistando titoli di stato, quindi maggiore è il tasso di interesse minore è il

consumo;

ii) Reddito disponibile;

iii) Prezzi o l’attesa dei prezzi - Più alti sono i prezzi e minore è il consumo in quanto ci si aspetta

che questi caleranno in futuro;

2.7 Il breve ed il lungo periodo - Un esempio

È di fondamentale importanza la differenziazione fra lungo periodo e breve periodo, e pur essendo

elementare è di difficile rappresentazione analitica. Un esempio di tale rappresentazione ci è fornito

da un ricercatore statunitense, J. S. Duesenderry, il quale si accorse che nel periodo fra le due guerre

mondiali negli USA la relazione fra reddito e consumo non era del tipo c = µ + βy, ma era tale che:

ti o

un

i) Nel lungo periodo la propensione media al consumo (c/y) era costante - Considerando tutti gli

at

anni fra le due guerre i consumi degli americani rapportati al reddito davano un valore costante;

rb

pp

ii) Nel breve periodo la propensione media al consumo nelle fasi di recessione aumentava e nelle

fasi di espansione diminuiva - Differenziando il breve dal lungo periodo il comportamento dei

Ba

di

A

consumatori era differente;

Egli notò anche che, per ogni dato individuo, la propensione media al consumo diminuiva

la

all’aumentare del reddito: questo fatto venne spiegato da Duesenberry con l’ipotesi del reddito

relativo secondo la quale la percentuale di reddito consumato da ogni individuo non dipende

ue

direttamente dal reddito assoluto ma dalla sua propensione in termini percentili nella sua

distribuzione; in altre parole dal suo reddito relativo.

an

I quantili Em

Per chiarire il significato di percentuale (di una distribuzione, che nel caso specifico riguarda i redditi) si pensi di

ordinare in senso crescente i redditi, suddivisi in classi, e di associare a ciascuna classe delle frequenza (ovvero il

numero di individui che posseggono quel reddito) ottenendo in questo modo la distribuzione dei redditi. Il quantile n-

esimo di questa distribuzione indica il reddito ottenuto da quel soggetto al di sotto del quale si situa l’n % degli altri

individui.

Il secondo decile della distribuzione dei redditi può essere preso come indicatore della povertà (o della ricchezza)

economica in una popolazione: più è basso (alto) più poveri (ricchi) vi sono.

Analiticamente questo fenomeno è rappresentato con la seguente relazione:

dalla quale si evince che la propensione media al consumo dipende da una costante µ (positivo) e

0

dal rapporto fra il reddito allo stesso tempo del consumo e il reddito massimo ottenuto in passato [y

= max(y : s < t)] moltiplicato per β (negativo).

s

Si dimostra che questa relazione spiega sia il breve che il lungo periodo, infatti:

i) Lungo periodo - Nel lungo periodo si ipotizza che il reddito presente sia pari al reddito passato

più una piccola percentuale ovvero y = (1 + γ)y dove γ è il saggio di crescite ed è positivo.

t t-1 0

Quindi supponendo che il reddito sia sempre crescente y è pari proprio al reddito percepito nel

periodo precedente a quello presente, in tal modo il membro a destra diviene una costante (in

quanto lo diviene il secondo addendo di tale membro) e si verifica quanto sostenuto in

precedenza nel punto i);

ii) Breve periodo - Nel breve periodo si ha che, nelle fasi di recessione, il valore di y è minore del

t

0 0

valor di y quindi il rapporto y /y è inferiore all’unità. Questo termine moltiplicato per β che è

t

negativo ci dà un valore molto piccolo da sottrarre a µ quindi la propensione media al consumo

0

sarà più elevata. Al contrario nelle fasi di espansione il rapporto y /y è maggiore dell’unità e

t

moltiplicato per β restituisce una quantità più elevata del caso precedente quindi la propensione

media al consumo è più elevata.

Tali relazioni, ovviamente, non sono valide in ogni paese e in ogni tempo, ad esempio fra il 1970 e

il 2000 le ipotesi di Duesenberry valgono solo in alcune circostanze (Figura 2.7)

ti o

un at

rb

pp Ba

di

A la

ue

an

Em

Figura 2.7 - Dalla Figura si nota che in corrispondenza degli shock petroliferi degli anni settanta l’ipotesi del

Duesenberry è valida anche in Italia. Stessa cosa non si può dire per il 1993. 24

2.8 La stima dei minimi quadrati nel modello lineare semplice

2.8.1 Determinazione dei parametri

Ritorniamo ora alle stime dei minimi quadrati nel modello lineare e ricordiamo che in tale modello

vi è una variabile endogena y (cioè una variabile determinata endogenamente, ovvero all’interno

t 25

del modello) e una variabile esogena x (cioè una variabile determinata esogenamente, ovvero

t

all’esterno, del modello): y = µ + βx

t t

Il modello lineare in questione è detto semplice poiché contiene una sola variabile esplicativa.

Il criterio di stima dei minimi quadrati, come detto, consiste nel trovare i valori di µ e β che rendono

minima la somma dei quadrati dei residui:

La funzione che si ottiene è una funzione in µ e β la cui minimizzazione avviene prima di tutto

calcolando le derivate parziali prime e ponendole pari a zero (condizioni necessarie):

ti o

un at

Le equazioni presenti nel sistema, la cui risoluzione è presente di seguito, sono dette equazioni

normali: rb

pp Ba

di

A la

ue

an

Em

Tale modello prende il nome di modello dei minimi quadrati ordinario per distinguerlo da altri modelli

24

come il metodo dei minimi quadrati ponderati.

È sicuramente fuorviante chiamare x variabile esogena in quanto questa potrebbe essere una variabile

25 t

endogena in un’altra equazione, ecco perché in generale viene definita variabile esplicativa.

26

con m diverso dal quadrato della media di x , questo perché il denominatore deve essere diverso

xx

da zero.

Condizioni sufficienti per la stima dei minimi quadrati

Per far sì che µ e β siano due minimi è necessario che venga soddisfatta anche la condizione sufficiente del

second’ordine, ovvero è necessario che la forma quadratica associata alla matrice Hessiana sia definita positiva e ciò

avviene se i minori principali dominanti sono tutti strettamente positivi.

Costruiamo quindi la matrice Hessiana e otteniamo:

Generalmente queste condizioni sono soddisfatte.

Le equazioni normali presentano delle caratteristiche fondamentali: ^

Prima equazione normale - Il valore medio delle y è pari al valore medio delle y stimate che si

^ ^

e β :

ottengono se al posto di µ e β pongo i valori stimati di µ ti

Seconda equazione normale - La seconda equazione mi dice che la somma dei residui moltiplicati

o

un

è pari a zero. Questa relazione è sicuramente meno utilizzata della precedente ma è altrettanto

per x

t at

importante poiché da questo si evince l’ortogonalità dei residui stimati rispetto alla variabile

27

esplicativa x : rb

pp

t Ba

di

A

2.8.2 Interpretazione statistica la

Il criterio dei minimi quadrati illustrato nei paragrafi precedenti (sviluppato indipendentemente da

ue

28

Gauss e da Legendre tra la fine del diciottesimo e gli inizi del diciannovesimo secolo) utilizza

an

Quello illustrato è un sistema che prevede la stima di due soli parametri, infatti se vi fossero k parametri il

26 Em

numero di equazioni normali sarebbe pari a k.

L’ortogonalità della variabile esplicativa rispetto ai residui è molto importante perché suppone che i residui

27

che si ottengono siano non correlati con le variabili esplicative. Questa è la risposta analitica al fatto che i

residui nella realtà non sono dei White Noise.

Questo metodo venne utilizzato per studiare il sentiero ellittico dei pianeti intorno al sole.

28

concetti puramente matematici (deterministici e non probabilistici). Ad esso, tuttavia, possiamo dare

anche un’interpretazione statistica che riguarda solamente i nomi associati ad ogni elemento:

i) Il modello fin ora trattato è detto modello di regressione e la somma dei quadrati dei residui è la

devianza (dei residui o residuale)

ii) Le serie storiche {x } e {y } costituiscono il campione dei dati;

t t

iii) x e ȳ sono le medie aritmetiche delle due variabili

è il momento secondo non centrato di x e m è il momento secondo misto;

iv) m xx t xy

^ ^

e β sono ancora le stime, ma in senso statistico.

v) µ

Inoltre in termini statistici β può essere calcolato come rapporto fra la covarianza fra x e y e la

varianza di x:

2.9 Il grado di adattamento di un modello al campione dei dati

2.9.1 Scomposizione della devianza e coefficiente di determinazione centrato

Una relazione fra due variabili, ad esempio fra consumo e reddito, può essere rappresentata con

l’utilizzo di differenti modelli (come il modello lineare o il modello esponenziale nel caso della

relazione fra reddito e consumo). Ovviamente vi sarà un’interpolazione che si adatta meglio ai dati,

quindi, ci si domanda se sia possibile costruire un indicatore che permetta di misurare il grado di

adattamento (o di accostamento) di un modello al campione dei dati. La risposta è positiva e il più

importante fra questi indicatori è il coefficiente di determinazione (detto anche coefficiente di

correlazione multipla) il quale assumerà valore pari ad uno se il modello utilizzato è buono ed è pari

ti

a zero nel caso opposto. Per definirlo supponiamo che il modello contenga l’intercetta (che stimata

o

un

29

può valere anche zero) e scomponiamo la devianza (somma dei quadrati degli scarti dalla media)

at

delle y nel seguente modo (nota che si è svolto il quadrato di un binomio):

t rb

pp Ba

di

A la

Dimostrazione - Il termine misto è nullo ue

an

Em

Nota che la somma dei residui e la somma del prodotto della variabile x e dei residui sono pari a zero.

Nota che in generale, maggiore è la devianza maggiore è la distanza delle y (dati originari) dalla loro

29

media. Questo indicatore è di fondamentale importanza poiché esprime la variabilità di Y.

Da questa relazione si ottiene che la devianza totale (Total Sum of Squares TSS) è pari alla somma

della devianza di regressione (Explained Sum of Squares ESS) e della devianza residua (Residual

Sum od Squares RSS): Devianza di regressione Devianza residua

Devianza totale

dove la devianza di regressione è quella che spiega quanta parte delle osservazioni è valutata dal

modello, mentre la devianza dei residui non è altro che la somma dei quadrati dei residui stimati al

quadrato.

A questo punto dividiamo a sinistra e a destra per la devianza totale:

Si ottiene allora il coefficiente di determinazione (che è il quadrato del coefficiente di correlazione

multipla tra y e l’insieme delle variabili esplicative):

t

Quando tutta la variabilità della y (cioè l’insieme di tutte le deviazioni dalla media) è spiegata dalla

t

variabilità di regressione allora il modello risulta essere perfetto in quanto i residui sono molto

ti

2

piccoli e la devianza di regressione tende a zero. In questo caso R sarà pari a uno; nel caso opposto

o

un

se la devianza dei residui è un valore molto grande la variabilità totale coincide con quella residua

at

2

ed R è pari a zero e quindi la parte sistemica del modello non spiega niente. rb

pp

Un modo alternativo per determinare il coefficiente di determinazione è il seguente:

Ba

di

A la

ue

In particolare questo è detto coefficiente di determinazione centrato (sulla media) in quanto stiamo

an

considerando un intercetta non nulla. Esso è utilizzato per verificare la bontà di adattamento del

modello ai dati. Em

2.9.2 Coefficiente di determinazione non centrato

Esiste anche un coefficiente di determinazione non centrato ottenuto semplicemente eliminando al

2

denominatore nȳ :

A differenza del precedente questo coefficiente è utilizzato per fare diagnosi sul modello.

2.9.3 Considerazioni sul coefficiente di determinazione

L’interpretazione del coefficiente di determinazione che sia esso centrato o non centrato richiede

particolare attenzione specialmente se il modello contiene più di due variabili esplicative, infatti può

2

accadere che un valore molto elevato di R sia dovuto ad un µ, mentre β è poco significativo

dicendo in tal modo che y è pari ad una costante e che quindi il modello non ci permette di

t

effettuare una corretta analisi economica. Questo problema assume una particolare rilevanza anche

quando y e la variabile esplicativa x contengono ambedue una tendenza: può accadere infatti che il

t t

coefficiente di correlazione sia elevato in conseguenza di una tendenza a crescere o a ridursi delle

due variabili e non in relazione ad un’effettiva relazione economica fra le due variabili.

Un esempio di questa circostanza può essere fatto supponendo di mettere in relazione il reddito

mondiale con il numero di matrimoni in Australia stimando la seguente relazione:

y = µ + βm

t t

Evidentemente non esiste un’effettiva relazione economica fra queste due variabili ma se

determiniamo il coefficiente di determinazione probabilmente questo sarebbe molto elevato.

Questa circostanza è dovuta al fatto che sia i matrimoni in Australia che il prodotto interno lordo

mondiale hanno una tendenza a crescere, tendenza che può essere rappresentata come in Figura

2.9.3.1: ti o

un at

PIL Matrimoni

rb

pp Ba

di

A la

ue

Figura 2.9.3.1 - La tendenza lineare del PIL mondiale e dei Matrimoni in Australia

an

Da questo si ricava che il semplice uso della statistica può dar luogo a degli errori economici.

Una semplice verifica della bontà del coefficiente di determinazione può essere realizzato

Em

utilizzando le differenze di ordine q (a seconda dell’ordine della tendenza) per eliminare il trend

dalle variabili. Ad esempio lavorando con le differenze prime un’eventuale trend lineare viene

2

eliminato di modo che R diviene un misuratore effettivo dell’adattamento del modello ai dati.

Consideriamo una generica relazione lineare, la ritardiamo di un periodo e sottraiamo questa dalla

prima: y = µ + βx + u

t t t

y = µ + βx + u

t-1 t-1 t-1

Δy = βΔx + ε

t t t

dove ε è pari alla differenza dei residui al tempo t e dei residui al tempo t - 1.

t 2

A questo punto si passa alla stima della relazione appena trovata e se R è molto elevato allora

effettivamente sussiste una relazione fra x e y .

t t

2.9.4 Eliminazione della tendenza lineare con una differenza prima

É semplice verificare che una differenza prima elimina un’eventuale tendenza lineare, infatti,

considerando che si parla di tendenza lineare se y = µ + βt + u , si dimostra che considerando una

t t

differenza prima il trend lineare è facilmente eliminabile:

Δy = y - y = (µ + βt + u ) - [µ + β(t-1) + u ] = β + ε

t t t-1 t t-1 t 2

Così come una differenza prima elimina una tendenza lineare, così una differenza seconda Δ

elimina una tendenza parabolica; e in generale una tendenza d - siam elimina un’eventuale tendenza

rappresentabile mediante un polinomio di grado d nel tempo.

2.9.5 Stima di una funzione - Esempio

Consideriamo il consumo come funzione del reddito negli anni 1980 - 2002:

c = µ + βy + u

t t t

Questa relazione esprime il consumo reale in funzione del reddito reale ed in particolare dalla

ti o

Figura 2.9.5.1 si nota che la relazione fra le due variabili è pressoché lineare:

un at

rb

pp Ba

di

A la

ue

an

Figura 2.9.5.1 - La Figura illustra il diagramma di dispersione che considera la serie storica dei consumi reali e quella

Em

rei redditi in Italia dal 1980 al 2002 (miliardi di Euro).

Considerando un modello lineare con la stima dei parametri si ottiene la seguente relazione:

c = -53.684 + 0,657y

t t

Cosa fondamentale in analisi di questo genere è relativa alla rappresentazione grafica dei residui i

quali risultano oscillare fra valori negativi e valori positivi anche se in realtà dovrebbero essere

distribuiti come un White Noise (ovvero non dovrebbero essere tutti positivi e tutti negativi in un

dato intervallo di tempo). Questo risultato (Figura 2.9.5.2) dipende dal fatto che il modello

considera una sola variabile esplicativa cosa non vera nella realtà infatti i consumi dipendono da

diversi fattori.

Figura 2.9.5.2 - La Figura illustra la serie storica dei residui della relazione lineare fra consumo e redditi annuali in

Italia fra il 1980 e il 2002.

2

Poiché l’R è pari a 0,993 potrebbe venire il dubbio che, come esposto in precedenza, ciò sia

derivato essenzialmente dalla presenza della tendenza. Consideriamo allora le differenze prime e

2

otteniamo a questo punto un R pari a 0,609 il quale è comunque relativamente alto quindi

possiamo concludere che effettivamente sussiste una relazione economica fra reddito e consumi in

Italia nel periodo considerato.

2.9.6 Il coefficiente di determinazione e scelta del modello

Ogni relazione può essere ottenuta con differenti modelli, ad esempio il consumo può essere visto in

relazione al reddito oppure in relazione al reddito disponibile. È necessario quindi individuare una

metodologia che permetta di utilizzare il modello che più si adatta ai dati che si posseggono. Uno

ti

dei metodi consiste nel calcolare il coefficiente di determinazione e di considerare quel modello con

o

2

R più elevato. un at

2.10 Omogeneità dei dati rb

pp

In statistica si suppone che i dati sino omogenei ovvero che non siano molto differenti gli uni dagli

Ba

di

A

altri, tuttavia in economia i dati sono spesso dissimili fra loro ad esempio i dati di soli 10 anni fa

non sono comparabili con i dati attuali a meno che non si fanno delle considerazioni di lungo

periodo. Da questo si evince che l’omogeneità dei dati è un concetto relativo che dipende dagli

la

obiettivi che l’analista si pone: in analisi di breve periodo dividere un campione in due parti e

ottenere delle stime differenti è rilevante e implica l’inesistenza di omogeneità dei dati; al contrario

ue

nel lungo periodo per analisi in media il fatto di avere dei valori differenti non procura nessun

problema anzi possiamo affermare che comunque vi è omogeneità dei dati. Oltre agli obiettivi

an

dell’analista un’altro fattore fondamentale è rappresentato dalla grandezza del campione, infatti più

numeroso è il campione più affidabili saranno le stime quindi potrebbe accadere che la suddivisione

Em

del campione procura stime diverse ma non affidabili.

Anche la specificazione dell’equazione da stimare dipende dagli obiettivi che ci si propone di

conseguire, dal grado di approssimazione che si vuole ottenere, e dal campione dei dati disponibili.

2.11 La non linearità rispetto alle variabili

Nelle specificazioni trattate fino a questo momento vi è una doppia linearità, infatti vi è linearità sia

rispetto ai parametri che rispetto che rispetto alle variabili. Anche in assenza di quest’ultima, in

generale è possibile ottenere un modello con doppia linearità attraverso opportune trasformazioni

30

che rientrano nell’ambito della linearizziazoine del modello . Ad esempio se vi è una variabile

logaritmizzata è possibile rendere lineare la specificazione imponendo che quel dato logaritmo è

pari ad un’altra variabile.

Stesse considerazioni non possono essere fatte relativamente alla linearità rispetto ai parametri,

risulta infatti complesso linearizzare una relazione rispetto a questi il che comporta non pochi

problemi visto che ad esempio non è possibile in tal caso utilizzare il metodo dei minimi quadrati.

Risulta allora che queste due linearità sono profondamente differenti fra loro: la linearità rispetto

alle variabili è facile da ottenere, mentre la linearità dei parametri è difficile da realizzare il che

comporta problemi di stima. Si cerca allora di partire da equazioni che sono lineari almeno rispetto

ai parametri.

Esempio - Supponiamo di considerare la funzione del consumo c = µ + βy dove β rappresenta la

t t

propensione marginale al consumo che è una costante nel lungo periodo. Al contrario nel breve

periodo β può aumentare o ridursi ad esempio negli ultimi anni in Italia la propensione marginale al

consumo ha avuto una tendenza crescente con una lieve riduzione nell’ultimo periodo (gli italiani

hanno negli ultimi sei mesi ripreso a risparmiare). Si nota quindi una tendenza crescente e poi

decrescente, per tale ragione possiamo allora vedere β come funzione (in questo caso lineare) del

tempo: β = γ + δt

Possiamo allora sostituire nella relazione iniziale questa funzione ottenendo:

c = µ + γy + δty

ti

t t t o

un

In questo modo non si ha più una funzione lineare nei parametri ma non lineare nelle variabili in

at

quanto compare il prodotto fra la variabile t e la variabile y . In ogni caso la linearità può essere

t rb

pp

ottenuta semplicemente ponendo ty pari ad una variabile w :

t t Ba

di

c = µ + γy + δw

A

t t t la

Da notare è che rispetto alla relazione iniziale, nella quale i parametri da stimare erano solo due,

abbiamo in questo caso tre parametri da stimare. Questo avviene spesso quando si tenta di

ue

linearizzare una relazione. an

Esempio - Un ulteriore esempio di linearizzazione si ha nella funzione di produzione di Cobb

Douglas: Em

α 1-α

Y = γL K

Nota che prima della liberalizzazione non è possibile parlare di modello lineare.

30

Tale relazione non è lineare né nei parametri né nelle variabili infatti da una parte i parametri α e 1 -

α costituiscono degli esponenti; e dall’altra le variabili risultano moltiplicate fra loro.

Tuttavia è molto semplice effettuare una liberalizzazione rispetto ai parametri e rispetto alle

variabili prendendo il logaritmo di entrambi i membri:

α 1-α

ln(Y)= Y = ln(γL K ) = ln(γ) + αln(L) + (1 - α)ln(K)

1 Y = ln(γ) + αX + (1 - α)X

1 1 2

2.12 Propensione media ed elasticità

Come più volte ricordato β, nella relazione fra consumo e reddito, rappresenta la propensione media

al consumo la quale risulta avere un andamento crescente nel tempo se consideriamo il breve

periodo mentre se consideriamo il lungo periodo sembra che questa sia costante.

È di grande interesse, nello studio delle relazioni economiche, la determinazione di quanto una

variabile possa cambiare in funzione di una variazione dell’esplicativa x , in altre parole è

t

interessante calcolare l’incremento percentuale della variabile y indotto dall’incremento

t

percentuale unitario della variabile esplicativa x . Questo valore prende il nome di elasticità (della

t

prima variabile rispetto alla seconda).

Nel calcolo dell’elasticità la trasformazione delle differenti variabili in logaritmi produce dei

risultati positivi sia da un punto di vista economico sia da un punto di vista statistico. Ciò è vero

perché da una parte, calcolando la differenza fra due due variabili, si ottiene immediatamente il

tasso di variazione che viceversa dovrebbe essere calcolato in maniera leggermente più complicata;

e dall’altra si riesce a determinare facilmente l’elasticità di cui si parlava poc’anzi. In generale

avremo che, date due variabili x e y, se prendo il quoziente delle derivate logaritmiche

immediatamente ottengo l’elasticità (in particolare questa relazione è più corretta da utilizzare nel

caso continuo): ti o

un at

rb

pp

Una buona approssimazione di η è data dal quoziente delle variazioni finite delle due variabili

Ba

di

A

considerate (utilizzata il più delle volte nel caso discreto): la

ue

2.12.1 La legge di Okun - Esempio an

La legge di Okun, stimata sulla base dei dati degli Stati uniti fra il 1947 e il 1960, studia la relazione

Em 31

fra le variazioni del tasso di disoccupazione e la crescita economica. Tale relazione è del tipo :

Da notare è che la relazione è priva di intercetta quindi quando andremo a calcolare R il suo valore non

31 2

sarà molto elevato Δu = β(ẋ - γ)

t t

dove Δu rappresenta il tasso di variazione della disoccupazione ed è pari a u - u

t t t-1

ẋ rappresenta il tasso di crescita economica ed è pari a (x - x )/x

t t t-1 t-1

γ rappresenta il tasso di crescita medio di lungo periodo

β è negativo

In particolare Okun andò a studiare quelle situazioni in cui il tasso di crescita è più elevato rispetto

al tasso di crescita medio (ovvero siamo in una situazione di espansione) e quelle situazioni in cui il

secondo è maggiore del primo (ovvero siamo in una situazione di recessione). Nella prima ipotesi,

dato che β è negativo, avremo che la disoccupazione si ridurrà; nella seconda il tasso di crescita

diverrà più elevato.

Va notato che, tuttavia, tale legge non è sempre valida; basta infatti modificare il tempo o

semplicemente il paese per mostrare che tale relazione non è più valida. Spetta poi all’econometrico

modificare, sulla base dei dati che possiede, la relazione di modo che questa torni ad essere valida.

2.12.2 Relazione fra tasso di cambio nominale e prezzi relativi

Il tasso di cambio sta svolgendo negli ultimi mesi un importante ruolo nella ripersa del paese ed in

particolare abbiamo avuto una riduzione del tasso di cambio Euro/Dollaro (certo per incerto) e

quindi vi è stato un deprezzamento della moneta europea rispetto a quella statunitense.

Queste indicazioni sono facilmente rese analitiche costruendo una relazione fra il tasso di cambio ω t

e il rapporto fra l’indice dei prezzi al consumo USA e l’indice dei prezzi al consumo per l’Italia (x -

t

prezzo relativo): ω = µ + βx

t t

Su questa relazione si basa il principio della parità dei poteri d’acquisto (PPP).

ti o

2.13 Le varie tipologie di dati - Serie storiche, dati sezionali e longitudinali

un at

Fino a questo momento ci siamo sempre occupati di considerare dati che sono riferiti ad istanti di

rb

pp

tempo differenti e che danno origine a quelle che sono definite serie storiche (times series). Accanto

a questi dati ve ne possono essere altri che invece sono riferiti ad unità di consumo, reddito, lavoro e

Ba

di

A

così via dando così luogo ai dati sezionali (cross - section data). Un campione temporale di

ampiezza n può essere costruito mediante indagini che si protraggono nel tempo oppure mediante

una disaggregazione temporale; mentre un campione sezionale di ampiezza N può essere estratto da

la

un’inchiesta puntuale nel tempo ad esempio da un’indagine sulla spesa di un gruppo di famiglie

oppure da un censimento. ue

Naturalmente esistono modelli nei quali abbiamo contemporaneamente dati sezionali e dati

temporali ad esempio si può pensare che ogni famiglia ha una propria funzione del consumo in

an

relazione al reddito definita dai parametri µ e β considerati costanti nel periodo di osservazione.

i i

Em

Esempio - Aggregazione delle funzioni di consumo delle famiglie

Ogni famiglia è rappresentata da una funzione del consumo in relazione al reddito:

c = µ + β y

it i i it

Se supponiamo che

le equazioni possono essere sommate membro a membro in modo da ottenere:

c = µ + βy

t t

la quale costituisce l’aggregazione sezionale della relazione precedente.

Un altro modo di aggregare le equazioni delle diverse famiglie è quello che si basa sulla conoscenza della

distribuzione del reddito: se la quota di reddito posseduta della i - esima famiglia è pari a λ e se supponiamo che la

i

somma di tali quote è pari a uno avremo:

Se il campione di famiglie considerato rimane costante negli n tempi i dati ad esso relativi sono

chiamati longitudinali o di pannello (panel data). Questi dati sono utilizzati per osservare i

cambiamenti nel comportamento dei consumatori oppure per effettuare indagini relative al lavoro

(indagine trimestrale sul lavoro). ti o

un at

rb

pp Ba

di

A la

ue

an

Em

3. L’ AMBIENTE STOCASTICO

Nel capitolo precedente ci siamo occupati di differenti relazioni lineari in ambito puramente

matematico per poi passare all’ambito statistico. Rivediamo ora lo stesso percorso in termini

stocastici.

3.1 I residui come enti aleatori - Le ipotesi deboli

Fino a questo momento i residui, da un punto di vista deterministico, sono stati considerato come

scarti fra valori osservati e valori teorici di una variabile y per ogni tempo t. Di fondamentale

t

importanza è, tuttavia, considerare il residuo, in ambiente stocastico, come una variabile casuale: al

variare della curva interpolante (o meglio al variare delle stime dei parametri µ e β) il residuo si

modifica. Da questo si evince come, prima di determinare le stime u è una variabile casuale in

t

quanto in tale situazione la curva interpolante, come anche la differenza fra valore osservato e

valore teorico, è indefinita; una vola effettuata la stima e determinata la retta si può dire che il

1

residuo diviene una realizzazione di una variabile casuale . Se nel modello lineare i residui sono

considerati aleatori il modello stesso è inserito in un ambiente stocastico e si scrive nel seguente

modo:

dove il simbolo fa riferimento al fatto che considero il modello in ambiente stocastico.

Nota che tale simbolo viene messo anche a sinistra della relazione infatti se vi è un ente aleatorio da

una parte necessariamente anche l’altro membro deve essere considerato tale. Il segno “ = “ è infatti

un simbolo che in questo caso rappresenta un’uguaglianza concettuale o meglio un’uguaglianza

delle caratteristiche (anche stocastiche). Queste considerazioni implicano non solo l’uguaglianza

numerica o l’uguaglianza stocastica dei due membri, ma anche il fatto che le caratteristiche

economiche proprie del membro di destra lo sono anche per il membro di sinistra (ad esempio la

ti

2

tendenza deve essere la stessa come anche la stagionalità ). o

un

In sostanza il residuo stocastico cattura delle caratteristiche di y che non sono spiegate dalla

t at

relazione trovata (generalmente la tendenza è spiegata al contrario della stagionalità infatti una

stagionalità in una data variabile non è sempre simmetrica a quella dell’altra variabile considerata).

rb

pp

Da ciò si evince l’importanza dello studio dei residui in quanto questi permetto di capire se la

relazione stimata spiega perfettamente i caratteri di y . Per meglio comprendere quanto detto

Ba

di

t

A

consideriamo un esempio: supponiamo di voler studiare la relazione fra tasso di interesse (x ) ed

t

investimenti (y ); è ben noto che non tutte le caratteristiche di questi ultimi possono essere spiegate

t

dalla relazione con il tasso di interesse infatti la prima variabile presenta una tendenza crescente il

la

che non è vero anche per il tasso di interesse (a meno che non si consideri un piccolissimo arco

ue

temporale nel quale abbiamo un repentino cambiamento del tasso di interesse). Questa mancanza

viene spiegata dal residuo il quale conterrà la tendenza che non siamo riusciti a spiegare con la

an

specificazione il che ci permetterà di affermare che il modello è errato.

Em

In generale in economia le variabili casuali hanno una distribuzione discreta anche se vi possono essere

1

variabili casuali continue (ad esempio la distribuzione di un parametro o dei residui).

In particolare se la stagionalità è presente in un solo membro questo va a finire nei residui.

2 Le variabili aleatorie

È aleatoria una variabile X che può assumere diversi valori e non si è priori quale di questi assumerà. I valori che X

può assumere sono detti realizzazioni ad ognuna delle quali è associata una data probabilità di realizzarsi.

Le variabili aleatorie si distinguono in:

i) Variabili aleatorie discrete - Le variabili aleatorie discrete sono quelle che assumono un numero finito o

numerabile di valori;

ii) Variabili aleatorie continue - Le variabili aleatorie continue sono quelle che assumono valori compresi in un dato

intervallo della retta reale.

La media delle realizzazioni ponderate con le rispettive probabilità costituisce il valor medio e rappresenta un indice

di localizzazione delle realizzazioni; al contrario la media dei quadrati degli scarti tra le realizzazioni e il valor medio

ponderato con le probabilità è detta varianza ed è un indice di dispersione. Tanto maggiore è la varianza tanto più

disperse sono le realizzazioni rispetto al valor medio.

Abbiamo infine la covarianza che è un indicatore del legame lineare esistente tra le due variabili aleatorie.

Sui residui definiti come variabili casuali è necessario fare delle ipotesi, il che è fondamentale per

3

ridurre le possibilità di variabilità di tale variabile aleatoria e per poter lavorare meglio con i dati .

Supponiamo, allora, che l’equazione riportata sopra rimanga inalterata nel periodo campionario;

avremo che l’insieme più semplice di ipotesi stocastiche che posso essere formulate rispetto ad essa

sono le seguenti:

i) Le variabili esplicative x devono essere note - Questa prima restrizione la si nota anche dal

∀t

t

modo di scrivere l’equazione, infatti non abbiamo la sulle variabili esplicative. Possiamo

considerare dei casi semplificati in cui le variabili esplicative sono note poiché ci sono fornite

da istituzioni statistiche come l’ISTAT e quindi si può supporre che siamo misurate senza errori;

al contrario vi possono essere dei casi più complessi nei quali, lavorando con più equazioni, è

di un modello siano le variabili endogene di un’altra relazione. In questi

facile che le variabili x

t

casi particolari anche le x sono riportate con la In definitiva possiamo dire che tutte le

∼.

t

variabili sono endogene in quanto quelle esplicative in un’equazione possono essere considerate

endogene un’altra equazione; ti o

un ) = 0]-

ii) Il valor medio dei residui, considerati come variabili aleatorie, è sempre pari a zero [E(u t

at

Al contrario di quanto si potrebbe pensare, il fatto di considerare la media dei residui pari a

rb

pp

zero, non è un’ipotesi altamente restrittiva in quanto se il valor medio è pari a k (quindi diverso

da zero) basterebbe sommare k al termine noto. Dire che la media a zero quando vi è una

Ba

di

tendenza dei residui è impossibile, tuttavia in questo caso possiamo dire che è il modello in

A ha una tendenza che non è spiegata;

generale ad essere mal specificato e che quindi y

t 2

iii) Il valore medio del prodotto di u

∼ per u

∼ è zero se t ≠ s ed è pari a σ se t = 2 - In sostanza si sta

t s la

4

dicendo che la covarianza fra i residui deve essere pari a zero mentre la varianza deve essere

ue

2

costante e pari a σ . Quest’ultima ipotesi è particolarmente restrittiva, visto che nella maggior

parte dei casi la varianza è un valore che muta nel tempo e che in questo caso è supposta

an

Queste restrizioni non sono necessarie in teoria ma solo in pratica visto che l’econometrico è condizionato

3 Em

dai dati realmente osservati. Spesso in economia accade, infatti, quello che viene chiamato Wishful thinking

ovvero si considera non quello che è realmente ma quello che si spera che sia.

Il fatto che la covarianza si nulla implica che i residui non sono in relazione lineare fra loro o come si dice

4

sono incorrelati. Ci possono essere quindi dei casi in cui la relazione fra i residui è non lineare (ad esempio

quadratica), quindi è possibile che la covarianza sia nulla ma non è detto che le variabili non siano collegate

l’una con l’altra.

costante. Per meglio comprendere l’importanza della restrizione consideriamo degli esempi

concreti. Consideriamo il guadagno di una famiglia in diversi decenni, partendo dagli anni ’50

si può notare che questo era abbastanza contenuto e che cresceva, inizialmente, con piccole

oscillazioni, ma in seguito con oscillazioni sempre maggiori dovute ad un’aumento della

varianza. In generale con l’aumento del livello di una variabile aumenta anche la sua variabilità,

vi sono tuttavia dei rari casi in cui la varianza decresce all’aumentare del tempo (è questo, ad

esempio, il caso dei prezzi nel mercato dei suini) oppure dei casi in cui la varianza è prima

crescente e poi decrescente (è il caso del prezzo delle obbligazioni molto influenzato da eventi

puntuali nel tempo come ad esempio la costituzione dell’UE il che ha creato delle forti tensioni

che si sono poi riversate sul prezzo delle obbligazioni). In questi particolari casi lo studioso

2

deve costruire dei modelli appositi in cui σ è funzione del tempo. Quando l’ipotesi relativa alla

varianza non è rispettata si parla di eteroschedasticità (dal greco etero -diverso- e skedasis -

disperso-); al contrario si parla di omoschedasticità quando la varianza è costante nel tempo.

5

Le ultime due ipotesi fanno si che il residuo possa essere chiamato White Noise .

Le ipotesi fatte non presuppongono alcuna forma di distribuzione di probabilità, ed è per tale

ragione che sono dette ipotesi deboli. Queste si differenziano dalle ipotesi forti che riguardano la

distribuzione di probabilità dei residui (funzione di densità se i residui sono delle variabili casuali

continue oppure la funzione di probabilità se i residui sono considerati nel discreto). Si nota che

quando si impongono delle ipotesi forti, ovvero impongo che i residui abbiano una distribuzione

particolare si restringe molto la possibilità di variazione di questi, quindi tale ipotesi è molto più

restrittiva di quelle deboli (la localizzazione dei residui è pari a zero, la dispersione è costante e i

residui non sono correlati fra loro). In altre parole, con l’ipotesi forte, non si impone solo che il

momento primo (il valor medio) e i momenti secondi (la varianza e la covarianza) siano di un certo

6

tipo, ma si impongono anche che i momenti successivi abbiano una data forma .

ti

3.2 Definizioni e risultati nell’approccio stocastico o

un at

L’equazione vista nel capitolo precedente, considerando le componente residuale come variabile

rb

pp

aleatoria, diviene anch’essa una variabile casuale. Questa è costituita da una componente

sistematica data dai primi due termini e da una componente aleatoria data dai residui:

Ba

di

A

La prima componente è detta sistematica in quanto rappresenta la struttura di y in funzione dei

t

la

parametri, consideranti invariabili nel tempo in virtù dell’omogeneità (paragrafo 2.10) del

campione, e della variabile esplicativa, supposta nota per le ipotesi del paragrafo 3.1. Questa

ue

componente quindi, non contiene alcun elemento aleatorio e denota i fatti stilizzati della relazione

tra la variabile endogena e quella esplicativa. an

Questa considerazione è importante anche perché mette in luce che le ipotesi stocastiche (paragrafo

3.1) esposte in termini di residui non osservabili, possono essere viste come ipotesi sulle variabili

Em

Il nome Rumore Bianco fa riferimento, da una parte, al fatto che crea disturbo al modello (rumore); e

5

dall’altra al fatto che le ipotesi su cui si basa, nella fisica dei colori, corrispondono ad un evento bianco.

Anche se i momenti superiori al secondo sono poco utilizzati in pratica, in teoria le ipotesi forti risultano

6

essere più restrittive per tale ragione. ∼

osservabili y considerate come realizzazioni di una variabile aleatorio y . Considerando questo

t t

possiamo allora calcolare il valor medio di y ottenendo:

t

pari cioè alla parte sistematica (considera che il valore della componente residuale è pari per

7

ipotesi a zero). ∼ :

Trattandosi di una variabile aleatoria possiamo anche determinare la varianza e la covarianza di y

t

Queste ultime due relazioni indicano che la struttura varianza - covarianza ipotizzata per la

componente residuale, si applica anche alla y dato che le due differiscono solo per la componente

t

sistematica. ∼

Si può concludere allora che quando vi è eteroschedasticità nei residui vi è anche per le y .

t

Per meglio comprendere quanto detto consideriamo la serie storica relativa alle retribuzioni lorde

complessive trimestrali in Italia fra il 1970 e il 1996 (Figura 3.2.1):

ti o

un at

Figura 3.2.1 - Retribuzioni lorde complessive in Italia, dati trimestrali grezzi (ovvero dati non destagionalizzati e non

corretti per le giornate lavorative) dal 1979 al 1996 (fonte ISTAT). rb

pp

Quello illustrato è un caso classico di eteroschedasticità (la varianza è infatti crescente nel tempo, si

Ba

di

A

nota che anche la tendenza lo è) che si può studiare sia sui residui sia sulla y . È interessante notare

t

che, da un punto di vista empirico, la tendenza (che indica la localizzazione) e la crescenza della

variabilità (che indica la dispersione) sono da trattarsi in modo ben diverso.

la

Soffermiamoci ora sulla non costanza della varianza: il fatto che vi sia eteroschedasticità comporta

non pochi disturbi il che necessità l’eliminazione di questa caratteristica. Esistono differenti metodi

ue

per eliminare l’eteroschedasticità, ma uno dei migliori è quello di considerare i logaritmi della

variabile il che porta alla riduzione dei dati grandi conducendo quindi ad una maggiore omogeneità

an

fra i dati (motivazione di carattere statistico). Il fatto di considerare i logaritmi della variabile

presentano anche delle motivazioni di carattere economico: considerando i logaritmi da una parte

Em 8

le differenze divengono percentuali e dall’altra le propensioni divengono elasticità .

Con questo non si sta dicendo che la componente residuale è di scarsa importanza, infatti è proprio tramite

7

lo studio di questa che si può verificare la bontà della specificazione fatta.

Alle volte motivazioni statistiche e motivazioni economiche spingono in direzioni opposte.

8

Anche se il miglior modo per eliminare la crescenza della varianza è prendere i logaritmi delle

variabili, non sempre questo è possibile: vi sono dei casi in cui il dato è negativo come nel caso

delle serie dei prezzi o le serie relative alle merci, infatti la differenza delle importazioni ed

esportazioni (che mostra come funziona l’economia di un paese rispetto all’esterno). La soluzione a

quest’ ultimo problema consiste nel considerare, al posto delle differenze, i rapporto (sempre

positivo) che consente di confrontare numeratore con denominatore.

3.3 Stime e stimatori dei minimi quadrati

Anche in ambito stocastico si utilizza il criterio dei minimi quadrati il quale conduce alle stesse

stime ottenute con metodi matematici e viste nei paragrafi precedenti. Infatti la minimizzazione è la

stessa e ciò che cambia è semplicemente la natura della serie storica dei residui {u , u , … u }

1 2 n

rappresentata da realizzazioni di una variabile aleatoria. In particolare in ambito stocastico non si

parla più solo di stime ma anche di stimatori ovvero le stime viste in ambito stocastico. In termini

più analitici avremo allora che le stime saranno le seguenti: ∼

y :

mentre gli stimatori possono essere ottenuti sostituendo a y

t t

ti o

un at

rb

pp

Si nota come questi ultimi sono funzione anche di u , in effetti quelle ottenute sono delle variabili

t

aleatorie ed è per questo che sono indicate con una anche se per semplicità d’ora in poi la

Ba

di

A

ometteremo.

Il fatto di determinare gli stimatori è fondamentale per individuare le principali caratteristiche e

la

e delle stime: la versione stocastica delle stime ci permette, infatti, di verificare

proprietà della y

t ue

immediatamente una prima loro buona proprietà ovvero la non distorsione. Dato che si tratta di

variabili aleatorie possiamo considerare la media degli stimatori:

an

Em 9

Si dice allora che gli stimatori dei minimi quadrati sono non distorti (o corretti) il che si dimostra

semplicemente calcolandone la media. Questa proprietà è importante perché permette di dire che la

^ ^

distribuzione di probabilità degli stimatori β e µ sono incentrate intorno al valore vero β e µ. In

questo caso le stime, che possono essere considerate come realizzazioni dello stimatore, hanno alta

probabilità di trovarsi vicino al valore vero del parametro.

3.4 Il teorema di Gauss - Markov

Gli stimatori OLS per i parametri del modello lineare non solo sono non distorti, ma godono di

un’altra proprietà che spiega la loro diffusa applicazione. Supponiamo di avere la seguente

equazione: y = µ + βx

e supponiamo di voler stimare i parametri dell’equazione. Fra i diversi metodi abbiamo il metodo

dei minimi quadrati che ha una particolare rilevanza, infatti sotto certe condizioni la varianza di µ e

β è la più piccola rispetto a quella che si otterrebbe con un qualsiasi altro stimatore. In maniera più

rigorosa possiamo dire che:

Teorema di Gauss - Markov ^ ^

∼ 10

e non distorti , se β e µ sono gli stimatori dei minimi

Tra tutti gli stimatori lineari rispetto alle y

t

∼ ∼ 11

quadrati e β e µ sono qualsiasi altri stimatori si ha che :

dove c e c (uguali in entrambi i membri) sono una coppia qualsiasi di costanti reali non ambedue

1 2

nulle.

Gli stimatori con variabilità minima nel senso del teorema di Gauss - Markov sono detti ottimi o

12

più sinteticamente sono detti BLU (Best Linear Unbiased ).

ti o

un

3.5 La correlazione tra le variabili e tra gli stimatori dei parametri at

rb

pp

Abbiamo detto in precedenza che per determinare la relazione lineare fra due variabili aleatorie è

sufficiente considerare la covarianza; essa tuttavia dipende dalla dimensione e quindi non può

Ba

di

A

essere utilizzata come indicatore dell’intensità del loro legame. Per ovviare a questo problema

(effetto dimensionale) possiamo cercare di normalizzare questo valore di modo da eliminare la

dipendenza dalla dimensione, questo è fatto dividendo la covarianza per il prodotto dello scatto

la

quadratico medio dell’una e dell’altra variabile ottenendo così un’indicatore adimensionale utile per

ue

an

Il valor medio così determinato presuppone che le variabili siano indipendenti in maniera tale che il valor

9

medio del prodotto sia pari al prodotto dei valori medi.

Em

Queste due proprietà devono essere rispettate affinché il teorema sia valido.

10 Nota che il teorema non fa riferimento alla varianza dei singoli stimatori ma alla varianza di una loro

11

combinazione lineare.

Non distorti.

12 13

misurare il grado di associazione lineare fra le due variabili . Si ottiene in questo modo il

coefficiente di correlazione (ρ):

Tale indicatore varia fra -1 (forte correlazione negativa) e 1 (forte correlazione positiva); in

particolare se è vicino allo zero non vi è correlazione lineare.

Il coefficiente di correlazione può essere stimato a partire da un campione di n osservazioni per y e

di altrettante per x facendo uso delle stime campionarie così come visto nel paragrafo 2.8.1.

Tuttavia va detto che queste stime sono distorte (ad esempio in statistica nel caso di varianze e

covarianze si dovrebbe dividere per n - 1 e non per n per eliminare la possibile distorsione) tuttavia

l’econometrico di fatto approssima i risultati quindi, generalmente (soprattutto quando n è molto

14

grande), non si tiene conto di questo .

3.6 Le ipotesi forti sui residui

È opportuno a questo punto riassumere le ipotesi di vario tipo sinora fatte in relazione al modello

ti

lineare semplice: o

un at

rb

pp

La misurazione della correlazione è di fondamentale importanza in econometria in quanto, quando si

13 Ba

di

vogliono costruire modelli con più equazioni, un primo passo da compiere consiste nel valutare la

A

correlazione che esiste fra le diverse variabili delle specificazioni. Un secondo utilizzo fa riferimento alla

visione della correlazione che esiste fra i parametri: dopo aver effettuato la stima e dopo aver considerato i

parametri come variabili aleatorie (quindi come stimatori) è importante andare a valutare la correlazione fra i

la

parametri. Questo è importante perché spesso gli stimatori che si ottengono sono fortemente correlati fra

loro, quindi la stima di uno (ovvero la realizzazione del corrispondente stimatore) è fortemente attratta dalla

ue

stima dell’altro quindi il risultato non è particolarmente affidabile ma dipende dalla relazione che esiste fra i

parametri. Un caso di particolare importanza è rappresentata dai casi di correlazione negativa, ovvero quei

an

casi in cui una stima è legata all’opposto dell’altra; in questi casi non si hanno delle stime affidabili ma

fortemente distorte. È questo la ragione per la quale è consigliato, quando si effettuano delle stime, indicare

Em

quel è la correlazione che esiste fra queste anche se molto spesso ciò non viene fatto anche quando non solo

la correlazione esiste ma è anche molto forte. In particolare in questi casi e quando si sta stimando

un’equazione multipla la cosa migliore da fare è eliminare la variabile esplicativa il cui coefficiente è molto

correlato con gli altri anche se questo riduce l’affidabilità della specificazione del modello.

Da notare è che al variare del modello abbiamo, a parità di dati una variazione nel coefficiente di

14

correlazione stimato.

i) Il campione è omogeneo e i parametri µ e β sono invariabili nel tempo - La struttura economico

rimane invariata nel periodo campionario e quindi è possibile considerare validi per tutti i tempi

i modelli da stimare;

ii) I valori di x sono noti, cioè non aleatori;

t

iii) Il valor medio dei residui è pari a zero (se non lo fosse poniamo il valore della media trovato

all’interno della costante) come anche la correlazione e la varianza è supposta costante. Queste

ipotesi son fatte per determinare la non distorsione, l’efficienza, le matrici di dispersione e

correlazione e la distorsione della varianza campionaria dei residui;

⁻ 2

- x ≠ 0 - Necessario solo nel caso si utilizza il criterio dei minimi quadrati.

iv) m xx

Tali ipotesi non sono tuttavia sufficienti per effettuare inferenza statistica completa sul modello, ad

15

esempio non sono sufficienti per determinare intervalli di confidenza o per fare verifiche di

ipotesi. È per tale ragione che devono essere quindi fatte delle ipotesi sulla distribuzione di

probabilità dei residui (ipotesi forti).

3.7 Gli intervalli di confidenza

Fino a questo momento abbiamo determinato le stime puntuali dei parametri, generalmente però è

possibile migliorare queste stime sostituendole con un intervallo di confidenza (si parla infatti di

stima intervallare). Lo statistico, infatti, il può delle volte non fornisce un solo valore ma fornisce

l’estremo superiore e l’estremo inferiore di un intervallo di modo da dare contezza non solo della

localizzazione della variabile, ma anche dell’incertezza della stima (più ampio è l’intervallo

16

maggiore è l’incertezza) .

In termini più formali possiamo dire che l’intervallo di confidenza riguarda un parametro θ anche se

∼ ∼

è conveniente definirlo per lo stimatore θ : un intervallo di confidenza per θ è un indicatore della

^

probabilità p che una realizzazione di questa variabile casuale, cioè la stima θ , sia vicina a θ. Fissato

ti

p, più piccolo è l’intervallo maggiore è la certezza che esso contenga il valore vero θ. Se definiamo

o

un

gli stremi dell’intervallo come θ’ e θ’’ possiamo scrivere formalmente: at

∼ rb

pp

P(θ’ < θ < θ’’) = p Ba

di

A

L’importanza di tale intervallo risiede nel fatto che, fissata la probabilità p, esso esprime il nostro

grado di fiducia sulla bontà della stima, cioè sul fatto che questa sia vicina al valore effettivo di θ.

la

ue

an

Em

Nel caso della determinazione di intervalli di confidenza si parla anche di affidabilità del modello, o in

15

termini più tecnici di probabilità dalla quale si fa conseguire la lunghezza dell’intervallo. Le ipotesi deboli

non permettono di valutare, però, le probabilità in quanto fanno riferimento solo al momento primo e ai

momenti secondi.

La lunghezza dell’intervallo di confidenza è funzione dei dati a disposizione: più sono i dati a disposizione

16

e più stretto è l’intervallo considerato e quindi maggiore è l’affidabilità delle stime.

17

Alla stima intervallare si associa una probabilità, spesso pari al 95% , che il parametro ricada

all’interno dell’intervallo stesso. Altri valori considerati sono 90% e 99%.

In particolare, quindi, l’intervallo di confidenza fornisce sia indicazione della localizzazione del

parametro; sia indicazione sulla bontà della stima nel senso che più stretto è questo intervallo più

questo è affidabile.

3.8 La standardizzazione dell’intervallo di confidenza

Gli estremi dell’intervallo di confidenza sono funzione dei dati e in particolare della numerosità dei

dati (infatti maggiore è il numero dei dati minore è l’ampiezza dell’intervallo di confidenza e quindi

si ha maggiore affidabilità), da questo si comprende che ogni qual volta il campione si modifica si

devono determinare nuovamente gli intervalli e soprattutto si devono nuovamente ricostruire le

18

ipotesi sulla distribuzione di probabilità dei residui (dato che le ipotesi deboli non sono sufficienti

per la costruzione dell’intervallo di confidenza). Tutto questo deriva dal fatto che al variare del

campione variano la media e la varianza dello stimatore. Per ovviare a questa problematica si usa

standardizzare la distribuzione di θ nel seguente modo:

∼ 19

il che comporta la riduzione di tutte le distribuzioni di θ ad una sola distribuzione .

La variabile aleatoria standardizzata è chiamata z e l’intervallo (θ’, θ’’] è trasformato nell’intervallo

20

(z’, z’’] i cui estremi non dipendono dal campione a differenza di quelli dell’intervallo originario.

Ci si chiede allora come si trasforma l’intervallo iniziale (θ’, θ’’] conoscendo l’intervallo (z’, z’’]

valido per la variabile standardizzata; questo è molto semplice da ottenere se consideriamo che:

z’ < z ≤ z’’ ti o

un at

infatti: rb

pp Ba

di

A

È per questo che in generale il 5% rappresenta quello che si definisce livello di significatività della stima

17

intervallare. la

Va considerato inoltre che per stime bilaterali il valore del 5% viene diviso in due associando il 2,5% a

sinistra e il 2,5% a destra; ciò non avviene nel caso di stime monolaterali.

ue

Questo perché dalla distribuzione dei residui si può risalire alle distribuzioni dei parametri, dei loro

18

stimatori e quindi degli intervalli di confidenza. an

Ad esempio da una Normale ci ridurremo ad una Normale Standard, da un Chi Quadrato otterremmo un

19 Em

Chi quadrato Standard e così via.

z’ e z’’ sono due valori forniti dalle tavole statistiche in relazione alla distribuzione che si considera, in

20

particolare trattandosi di distribuzioni standardizzate è possibile affermare che i parametri di queste saranno

costanti e quindi lo saranno anche le tavole.

Va inoltre notato che per determinare z’ e z’’ è necessario conoscere la forma della distribuzione dei residui e

quindi dello stimatore: è proprio qui che vengono utilizzate le ipotesi forti della distribuzione.

Quella ottenuta è una doppia disuguaglianza che necessita di due precisazioni:

∼ ∼

i) Essa definisce un intervallo di confidenza non più per lo stimatore θ ma per E(θ ) che è però

funzione di θ. In particolare se la stima è non distorta E(θ ) è pari a θ, quindi si costruisce in

questo modo un intervallo per il valore ignoto;

ii) Si deve aggiungere inoltre che l’intervallo è divenuto aleatorio (il che dipende dal fatto che gli

estremi sono delle variabili casuali) il che lo rende difficile da utilizzare in pratica, tuttavia,

^

poiché abbiamo una realizzazione della variabile aleatoria θ ,si preferisce sostituire a questo θ

ottenendo: ^ ^

θ -z’’σ ≤ E(θ ) < θ -z’σ

^ ^

[θ -z’’σ, θ -z’σ)

Il campione ottenuto, come si nota è indipendente dalla distribuzione visto che si riferisce ad una

variabile aleatoria che è sempre la stessa vale a dire z.

Un ulteriore elemento fondamentale è σ che rappresenta la deviazione standard della distribuzione

dello stimatore. In particolare possiamo avere due differenti casi:

i) σ è noto - La distribuzione utilizzata in questo caso è la normale;

ii) σ non è noto ed è necessaria una stima - Generalmente questa stima viene effettuata con la

stima campionaria indicata prima (paragrafo 3.5). Da notare è che tale stima implica

semplicemente che siano valide le ipotesi deboli. Se σ non è noto la distribuzione da utilizzare è

la T-Student.

Si dimostra che se l’intervallo di confidenza è fatto per la varianza, la distribuzione è quella del Chi

Quadrato; se lo facciamo per i parametri di un’equazione lineare generalmente la distribuzione è

ti

quella di una Normale. o

un at

In sintesi per costruire un intervallo di confidenza è necessario: rb

pp

i) Stimare θ - È necessario stimare il parametro θ con uno dei criteri a nostra disposizione, ad

Ba

di

esempio il criterio dei minimi quadrati, otteniamo così una stima puntuale;

A

2 - A tale scopo è necessario avere un campione tale per poter

ii) Determinare, se non noto, σ 2

stimare, con la varianza campionaria, σ ; la

iii) Determinare z’ e z’’ - Questi non sono funzione di una qualsiasi distribuzione, ma son funzione

di una specifica forma. Questi valori si ritrovano in tavole statistiche delle distribuzioni

ue

standardizzate. an

3.9 Residui normali Em

In generale la distribuzione che si utilizza per la standardizzazione è la Normale che ha una densità

che va da -∞ a +∞ (infatti z può assumere dei valori molto piccoli o molto grandi). Questa è

utilizzata perché presenta un’importante proprietà di carattere comportamentale. Per spiegare questa

proprietà consideriamo il residuo di una qualsiasi relazione macroeconomica ad esempio

consideriamo la relazione fra consumi totali e reddito totale di un dato paese c = µ + βy. La variabile

c è una variabile macroeconomica in quanto considera i consumi di tutti gli italiani fra i quali vi è

chi consuma di più e chi consuma di meno; stesso ragionamento vale per il reddito. Si conclude

allora che il residuo è ciò che rimane dalla somma dei consumi da una parte e dei redditi dall’altra e

quindi sarà appunto una somma di tutto ciò che manca a giustificare la relazione fra redditi e

consumi (si tratta in sostanza dei una somma di differenze fra dato empirico e dato teorico) la quale

si distribuirà normalmente per n che tende ad ∞. Infatti a tale proposito si utilizza il Teorema del

limite centrale con il quale possiamo affermare che, presa una variabile aleatoria che è somma di n

21

altre variabili aleatorie indipendenti (in probabilità) e identicamente distribuite (ovvero hanno

tutte la stessa distribuzione) , se n tende ad ∞ la distribuzione di tale somma tende ad essere

22

Normale .

Dato che per il caso in questione vale il teorema del limite centrale si può dire che la densità della

somma dei residui deve essere uguale al prodotto delle funzioni di densità di tutti i residui (dei

diversi individui nel caso ad esempio della relazione dei consumi e dei redditi) ovvero questi sono

23

indipendenti . In termini più rigorosi possiamo dire che per poter effettuare inferenze statistiche sul

modello lineare è necessario imporre delle ipotesi sulla distribuzione dei residui ed in particolare

bisogna imporre che questi siano distribuiti normalmente con media nulla e varianza costante. Lae

motivazioni di tale ipotesi, oltre a quella già esposta che è la principale, sono essenzialmente il fatto

che tale distribuzione consente di effettuare agevolmente inferenza sui dati ed è poco restrittiva

poiché è valida nella maggior parte dei casi (teorema del limite centrale).

3.10 Inferenza statistica per i parametri del modello linee semplice 2

Applichiamo le nozioni dei paragrafi precedenti supponendo per semplicità che σ sia noto. Per

determinare gli estremi di un intervallo di confidenza per il parametro µ oppure β dei modelli visti

^ ^

in precedenza, occorre determinare innanzitutto la distribuzione di probabilità degli stimatori β e µ .

I loro valori medi sono rispettivamente β e µ; mentre le varianze possono essere ottenuto nella

maniera seguente: ti o

un

In termini approssimativi dire che una variabile aleatoria e indipendente in probabilità da un’altra implica

21 at

che non esiste alcun tipo di relazione probabilistica fra le due; in particolare si dice che due variabili aleatorie

sono indipendenti se la distribuzione di probabilità congiunta si fattorizza nelle distribuzioni marginali. Si

rb

pp

dimostra che se due variabili aleatorie sono indipendenti saranno anche incorrelate, ma non vale il viceversa

a meno che non si stia parlando di una distribuzione Normale. Ba

di

A

L’ipotesi di indipendenza e uguale distribuzione sono particolarmente lontane dalla realtà, in ogni caso

22

possiamo dire che, se da una parte le distribuzioni possono essere abbastanza simili le une con le altre,

dall’altra non è sempre possibile parlare di indipendenza visto che nei fenomeni economici soprattutto quelli

la

relativi al consumo vi è la moda che porta alla dipendenza fra le differenti variabili (ad esempio il fatto di

avere un cellulare può spingere altri ad acquistarlo). Ad ogni modo possiamo supporre che queste relazioni

ue

siano vere in maniera approssimativa e quindi vale il teorema del limite centrale (cosa in particolare provata

dai sociologi). an

In merito all’indipendenza possiamo fare la seguente considerazione: non è detto che se due variabili

23

aleatorie sono non correlate fra di loro (quindi hanno una covarianza nulla) siano indipendenti in quanto

Em

questa relazione indica una relazione solo lineare. Tuttavia la stessa affermazione non vale per una Normale,

infatti se le variabili casali sono Gaussiane la correlazione implica l’indipendenza (se le variabili aleatorie

sono incorrelate saranno anche indipendenti). Queste considerazioni derivano dal fatto che la distribuzione

Normale dipendono solo dal momento primo e dal momento secondo, quindi dato che la covarianza è un

momento secondo. Da ciò deriva che se sono il momento primo e i momenti secondi a vincolare la

distribuzione di probabilità, basta il vincolo della covarianza per poter dire che le variabili sono indipendenti.

Gli intervalli di confidenza allora sono i seguenti:

Dove gli estremi z’ e z’’ sono facilmente ricavabili dalla tavola statistica dei quantici della

^ ^

24

distribuzione normale standardizzata in quanto la distribuzione di β e µ sono normali. Ciò si

evince dal fatto che tali stimatori sono combinazioni lineari di variabili normali:

^

^ 2 2 2 2

a ); β N(β σ a )

µ

. N(µ, σ ∼

∼ µ β ^ ^

Queste due variabili quindi divengono delle normali standard dividendo β e µ per rispettiva media e

varianza.

3.11 Verifiche d’ipotesi ti o

un at

Le ipotesi che vengono fatte sui modelli di regressione riguardano generalmente i suoi parametri e il

campione a disposizione può essere usato per verificare se esso spinge a ritenere vera o falsa tale

rb

pp

ipotesi. Ad esempio nel modello lineare semplice ci può interessare verificare l’ipotesi che

l’intercetta µ sia uguale a zero oppure che la pendenza sia pari uno. In effetti la prima cosa da farsi

Ba

di

A

quando si specifica un modello, soprattutto se è un modello a più variabili, è andare a verificare se i

coefficienti delle diverse variabili esplicative sono diversi da zero. Questo è fondamentale perché se

25

qualcuno di questi fosse nullo si modificherebbe la specificazione fatta .

la

Quanto detto non deve far pensare che le verifiche d’ipotesi sono utilizzate in econometria solo per

le questioni sopra esposte, ma sono utilizzate anche per ipotesi più complesse come la presenza di

ue

an

Em

In particolare se α = 0,05 avremo z’ = -0,658 e z’’ = 0,658; se α = 0,01 avremo z’ = -0,678 e z’’ = 0,678; se

24

infine α = 0,10 allora z’ = - 0,632 e z’’ = 0,632.

Ad esempio gli economisti formulano equazioni in maniera differente a seconda della corrente di

25

pensiero , quindi chi si occupa dell’analisi dei dati deve scegliere quel modello che meglio si adatta a questi

ultimi. Da questo si comprende quindi l’importanza di verificare se alcuni dei parametri sono pari a zero in

quanto in questi casi si potrebbe passare, senza accorgersene, da un modello ad un’altro.

omoschedasticità o in alternativa eteroschedasticità; la presenta di una tendenza e più in generale

26

relativamente alle caratteristiche delle variabili o di una combinazione lineare di variabili .

L’ipotesi che vogliamo verificare prende il nome di ipotesi nulla e si indica con H mentre l’altra

0

prende il nome di ipotesi alternativa e si indica con H . Nel caso in cui con l’ipotesi nulla si vuole

1

verificare richiede che un parametro sia diverso da un determinato valore allora si parla di ipotesi

bilaterali poiché il parametro può assumere valore minore o maggiore di quello dato; in alternativa

prende abbiamo le ipotesi monolaterali.

Lo stesso intervallo di confidenza può essere utilizzato per fare un test d’ipotesi, ad esempio

supponiamo di voler verificare che il parametro µ sia uguale a zero (H = 0). Standardizziamo

0

^

quindi la variabile µ e otteniamo:

Supponiamo ora di considerare un livello di confidenza pari a α = 0,05, quindi avremo che la

variabile standardizzata ha il 95% delle probabilità di ricadere nell’intervallo [z’, z’’): si è spinti ad

accettare l’ipotesi nulla se il valore appena calcolato a partire dal campione dei dati, cade

nell’intervallo; mentre si è spinti a rifiutarla se il valore di z che si ottiene cade al di fuori

dell’intervallo (ovvero nelle code). Questa test prende il nome di test della z così chiamato per via

delle variabili standardizzate. È questo il motivo per cui l’intervallo di confidenza anche detto

regione di accettazione del test mentre le due code formano la sua regione di rifiuto, infine gli

estremi dell’intervallo z’ e z’’ prendono il nome di valori critici del test.

Il fatto più importante da tenere presente quando si effettua un test d’ipotesi è che esso opera in

ambiente stocastico e che la realizzazione di z associata all’ipotesi nulla cade nell’intervallo di

accettazione co una certa probabilità ma non con certezza.

In termini più generali possiamo sintetizzare il test d’ipotesi nelle seguenti fasi:

ti ^

: θ = r, supponiamo che lo stimatore di θ sia

i) Supponiamo di voler verificare l’ipotesi nulla H

0 o

un

non distorno (di θ) e che si distribuisca normalmente con media θ e varianza σ 2 ;

θ at

ii) Standardizziamo la variabile e sostituiamo a θ il valore r: rb

pp Ba

di

A

iii) Scegliamo a questo punto il livello di significatività α e troviamo i valori degli estremi z’ e z’’.

la

Nel caso in cui il valore della variabile aleatoria normale standardizzata rientra nella regione di

accettazione allora si è spinti ad accettare l’ipotesi nulla, in alternativa si è spinti a rifiutarla.

ue

Importante è considerare che differenti test possono portare a risultati differenti e quindi non si deve

an

dire che accettiamo o rifiutiamo l’ipotesi nulla, ma si è spinti ad accettarla o rifiutarla.

Em

Vi sono alcune verifiche d’ipotesi che inducono a ritenere che il modello dei minimi quadrati non sia

26

utilizzabile.

3.12 Errore di prima specie e errore di seconda specie

Supponiamo di valor verificare che un dato parametro, nel nostro caso µ o β, sia pari ad un

determinato valore. In particolare saremo spinti ad accettare l’ipotesi nulla qualora il valore della

variabile standardizzata ricada nella regione di accettazione; viceversa avviene quando tale valore

ricade nella regione di rifiuto. Sebbene, generalmente, il valore di z ricade con alta probabilità nella

regione di accettazione può accadere che questo cada nelle code e quindi si è spinti a rifiutare

l’ipotesi nulla pur essendo questa vera. In questo caso si commette un errore di prima specie (che

in sintesi si commette quando si rifiuta un’ipotesi nulla quando questa è vera) e la probabilità di

commettere tale errore è pari ad α. Il caso opposto avviene invece quando si accetta per vera

l’ipotesi nulla che in realtà non lo è, il che ci fa commettere un errore di seconda specie.

3.13 Inferenza statistica per la varianza dei residui

2 dei residui

3.13.1 Stima puntuale di σ 2

Tutto quello detto fin ora è valido solo nel caso in cui è nota σ , tuttavia nella maggior parte dei casi

la varianza dei residui non è nota e quindi necessita di una stima. La stima di questo valore può

essere fatta considerando la varianza campionaria:

Da questa stima, calcolando la radice quadrata si ottiene una stima dello scarto quadratico medio

passando quindi alla stima della varianza di µ e di β.

Tale stima ha tuttavia il demerito di essere distorta tuttavia, per ovviare a questa problematica basta

dividere la somma dei quadrati dei residui non per n ma per tale valore meno il numero dei

parametri che andremo a stimare, nel nostro caso 2: ti

In ogni caso questa stima dà indicazione della bontà di un modello rispetto ad un’altro: meno i

o

valori dell’endogena y sono dispersi intorno alla retta di regressione e più piccola è la varianza

un

t at

stimata e quindi migliore è il grado di adattamento della retta ai valori di y . In linea di massima,

t

2

quindi, si cerca di avere quel modello che minimizza σ o comunque la sua stima. In questo senso la

rb

pp

radice quadrata della varianza, detta errore standard della regressione è un ottimo indicatore della

bontà di adattamento del modello ai dati alla stessa stregua del coefficiente di determinazione.

Ba

di

A

2

3.13.2 Stima intervallare di σ dei residui la

2

Anche per σ è possibile effettuare una stima intervallare considerando che in questo caso non viene

ue

2

utilizzata la distribuzione Normale, ma quella di χ (Figura 3.13.2.1). Questo deriva dal fatto che lo

^ ∼ 2

ha la stessa distribuzione di u , ovvero è una normale con media 0 e varianza σ . Di

stimatore u t t an

^ 2

si distribuisce come un χ con n - 2 gradi di libertà

conseguenza la somma del quadrato delle u t

(nota che in questo caso specifico abbiamo due parametri da stimare).

Em

n - 2 = 30

n - 2 = 20 n - 2 = 10

Figura 3.13.2.1 Chi quadrato - Ovviamente questa distribuzione appare appropriata visto che parte da zero, infatti la

varianza è un valore sempre positiva quindi è evidente che la distribuzione non può essere che questa. La distribuzione

del Chi quadrato con n - 2 (in generale è dato da n meno il numero dei parametri da stimare) gradi di libertà, cresce fino

ad una certa moda per poi andare lentamente verso +∞. Le nozioni valide per i parametri µ e β sono valide per la stima

2

intervallare di σ , l’unica su cui prestare maggiore attenzione è l’estremo di sinistra dell’intervallo di confidenza.

Generalmente questo è pari a zero e quindi di fatto non abbiamo la coda sinistra come avveniva nel caso di µ e β e la

probabilità nella coda di destra è pari al 5%; vi sono tuttavia dei casi in cui l’intervallo di confidenza ha come estremo

sinistro maggiore di zero quindi vi saranno anche le code a sinistra.

Da quanto detto risulterà allora che la seguente somma si distribuisce come un Chi quadrato

standardizzato:

Costruiamo allora l’intervallo di confidenza: ti o

dove, come già scritto z’ e z’’ non si riferiscono alla Normale standardizzata ma ai quantici di

un at

probabilità della distribuzione Chi Quadrato con n - 2 gradi di libertà. Ovviamente questi saranno

differenti in valore assoluto fra loro visto che quella data non è una distribuzione simmetrica come

rb

pp

la Normale. Ba

di

A 2

3.13.3 Verifica d’ipotesi lineari semplici per σ dei residui

È possibile fare anche un test d’ipotesi sulla varianza considerando che questa può essere pari ad un

la

certo valore r oppure no. Questo test prende il nome di test del Chi quadrato appunto perché

ue

consideriamo tale distribuzione per individuare la regione dei accettazione o di rifiuto. Quello che si

fa è calcolare il seguente valore: an

Em

per poi verificare se ricade nella regione di accettazione o nella regione di rifiuto (ricordando che la

Chi quadro è una distribuzione di soli valori positivi quindi di solito poniamo l’estremo inferiore

pari a 0 e la coda di sinistra è assente).

3.13.4 Altre considerazioni di carattere statistico ed economico

La stima della varianza dei residui, come detto, può essere utilizzata come indicatore

dell’adattamento del modello ai dati. Affinché questo indicatore sia molto piccolo è necessario

dividere per n molto grande (o n - 2 nel caso della varianza campionaria non distorta) il che

comporta l’aumento dei gradi di libertà della variabile Chi Quadrato.

Tuttavia da un punto di vista economico l’aumento di n, e quindi del numero delle osservazioni, non

rappresenta un elemento positivo in quanto la funzione che si stima in tal modo non è affidabile. La

maggior parte delle variabili economiche infatti si evolvono nel tempo e quindi la maggior parte di

queste non è influenzata da valori troppo in là nel tempo. Per queste ragioni si deve cercare di

trovare quel n ottimo che consideri sia le affermazioni statistiche sia le affermazioni

dell’economista. Per far questo non esiste una regola ben precisa ma si devono considerare diversi

elementi che si riescono a cogliere dopo molta esperienza nella stima dei modelli. 2

3.13.5 Inferenza statistica per i parametri del modello lineare semplice con σ ignoto

Per determinare un intervallo di confidenza e per dire se una certa stima è affidabile o meno è

necessario conoscere la varianza dei residui, se si conosce si costruisce facilmente l’intervallo di

confidenza dei parametri e si usano le tavole della Normale per la definizione finale di z’ e z’’. Tale

procedimento non sempre funzione poiché la varianza dei residui non è sempre nota. Generalmente

questa viene stimata (metodo campionario, o altri metodi). Se utilizziamo una stima della varianza

dei residui non si può dire che la distribuzione dei parametri è Normale ma dobbiamo considerare la

T-Student non troppo dissimile dalla Normale.

2

In termini più rigorosi quando σ non è noto la determinazione degli intervalli di confidenza e i test

d’ipotesi visti nei paragrafi precedenti non possono essere utilizzati. Supponiamo a questo punto di

^ ^

stimare la varianza con quella campionaria non distorna e di standardizzare β e µ nel seguente

modo: ti o

un at

rb

pp Ba

di

A

Le variabili così standardizzate si distribuiscono allora come una t di Student in quanto rapporto di

la

una normale e di un Chi Quadrato indipendenti. A questo punto determiniamo gli intervalli di

ue

confidenza come segue: an

Em

dove t’ e t’’ sono i due quartini della t di Student con n - 2 gradi di libertà;

⁻ e σ α sono detti errori standard.

i due denominatori σ α µ β 2

Per quanto riguarda la verifica d’ipotesi nel caso in cui σ dei residui dobbiamo valutare se le t di

Student standardizzate, riportate di seguito, rientrano nell’intervallo di accettazione [t’, t’’) in tal

caso si è spinti ad accettare l’ipotesi nulla in alternativa si è spinti a rifiutarla:

La distribuzione della t di Student è più schiacciata della normale, alla quale si avvicina

progressivamente all’aumentare dei gradi di libertà. Dato allora che le code di questa distribuzione

sono più alte, i quantili, a parità di area, sono tanto più esterni rispetto a quelli della normale quanto

minore è il numero di gradi di libertà. Questo significa che gli intervalli di confidenza e le regioni di

accettazione definiti usando la distribuzione della t sono maggiori di quelli costruiti usando la

2

normale. Questo risultato ha un fondamento intuitivo, dato che quando il parametro σ è ignoto

l’incertezza relativa al modello è maggiore, e quindi i margini di incertezza nelle stime (gli

intervalli di confidenza) sono più ampi. Questa verifica è detta anche test della t di Student.

3.14 Considerazioni finali sulla stima dei parametri e sugli intervalli di confidenza

Nella stima dei parametri di un’equazione è fondamentale la verifica d’ipotesi la quale consente di

valutare se un dato parametro è pari a zero, il che comporta l’eliminazione dall’equazione di una

variabile e cioè la modifica della specificazione teorica fatta. In altre parole ogni volta che si stima

un’equazione è obbligatori verificare l’ipotesi nulla che ciascun parametri sia uguale a zero in

quanto ciò è estremamente significativo nell’analisi economica: se si è spinti ad accettare l’ipotesi

nulla allora si è indotti ad eliminare l’effetto di una variabile esplicativa. Per tale ragione tutti i

programmi di calcolo forniscono il valore t o il relativo SE oltre alla stima del parametro, dove il

n-2

primo è immediatamente ottenuto dividendo la stima per il suo SE.

ti

Facciamo ora un esempio per capire meglio come mostrare un modello stimato: o

un at

Prima di tutto va scritta l’equazione

sottintendo a µ e β le stime puntuali

rb

pp

Bisogna poi indicare lo Standard ottenute

Error o la t di Student (possono

essere anche inserite entrambe Va riportata inoltre la lunghezza del

Ba

di

A 2

campione, e l’R

la

Si indicano infine lo Standard Error dei residui; la devianza residua (RSS -

ue

Residual Sum of Square) e la devianza totale (TSS - Total Sum of Squares)

an

In questo particolare caso si è spinti a rifiutare l’ipotesi nulla quindi sia µ che β sono diversi da zero.

In generale quando si ha a disposizione la statistica t è possibile immediatamente valutare se

Em

accettare o meno l’ipotesi nulla in quanto, se il livello di significatività è pari ad α 0 5%, l’intervallo

di accettazione va da circa -2 a circa 2. Raramente però abbiamo valori molto distanti dall’intervallo

di accettazione, vi sono dei casi in cui il valore di t è molto al margine dell’intervallo detto e quindi

l’analista sulla base delle sue esperienze, cerca di fare altre considerazioni sull’accettazione o meno

dell’ipotesi nulla. Importante è quindi l’esperienza dell’analista, infatti se avessimo dei valori molto

vicini alla regione di accettazione quindi si devono fare delle considerazioni su quello che risulta

essere più plausibile da un punto di vista economico anche se statisticamente si sarebbe portati a

dire che una data variabile deve essere eliminata dal modello. Questo appare fondamentale quando,

in un’econometria superiore, vengono fatti più test che risultano essere opposti gli uni con gli altri.

3.15 Le principali distribuzioni statistiche in econometria

Le principali distribuzioni statiche utilizzate in econometria sono le seguenti.

3.15.1 La distribuzione Normale

La distribuzione di probabilità più importante è la Normale o Gaussiana che ha la forma della

sezione di una campana con lembi infiniti (Figura 3.15.1.1), tale forma è determinata

27

dall’esponenziale presente nella relazione matematica che la caratterizza .

ti

Figura 3.15.1.1 - Curva Normale o

un at

La relazione matematica che identifica la normale è la seguente: rb

pp Ba

di

A 2

28

Questa distribuzione dipende da due soli parametri la media (µ) e la varianza (σ ) ed è questo che

la rende decisamente semplice da utilizzare. Infatti molta della teoria econometrica si basa su questa

la

distribuzione che è scarsamente utilizzata empiricamente.

La sua principale particolarità è il fatto di essere simmetrica quindi il suo punto più alto (la modo) è

ue

in corrispondenza della media, in altre parole è concentrata su µ.

Le principali caratteristiche di questa distribuzione possono essere sintetizzate come di seguito:

an

Em

Il fattore (2πσ ) è un semplice fattore di normalizzazione in quanto per convenzione si suppone che

27 2 -1/2

l’integrale sull’insieme di definizione di una densità debba essere pari ad 1.

La varianza descrive la precisione quindi minore è tale parametro maggiore sarà la precisione con la quale

28

valuteremo la variabile aleatoria.

i) Man mano che ci si allontana dal valore medio la probabilità che la variabile casuale assuma

valori contenuti in un intervallo infinitesimale a destra o a sinistra diminuisce;

ii) La superfici che giace sotto la curva normale vale il 68% nell’intervallo [µ - σ, µ + σ), vale il

95% nell’intervallo [µ - 2σ, µ + 2σ) e il 99,7% nell’intervallo [µ - 3σ, µ + 3σ) (Figura 3.15.1.2);

µ - 3σ µ - 2σ µ - σ µ µ + σ µ + 2σ µ + 3σ

68%

95%

99,7%

Figura 3.15.1.2 - Intervalli e valori corrispondenti di una distribuzione Normale

iii) La combinazione lineare di due o più variabili aleatorie normale è normale. Nel caso specifico

di due variabili normali avremo che la loro combinazione lineare sarà normale con media pari

alla combinazione lineare delle medie e varianza pari alla combinazione lineare delle varianze

alla quale sommiamo un termine che considera la covarianza fra le variabili normali di partenza

(ovviamente se le variabili di partenza sono incorrelate allora anche la varianza è pari alla

combinazione lineare delle varianze): ti o

un at

iv) Minore è la varianza e più concentrata è la distribuzione attorno al valor medio e quindi

rb

pp

maggiore è il grado di precisione con il quale si possono effettuare le stime di un parametro con

questa distribuzione; Ba

di

A

v) Se due variabili aleatorie sono incorrelate fra loro allora sono anche indipendenti ovvero la loro

funzione di densità multivariata è uguale al prodotto delle densità marginali;

la

2

vi) Se µ = 0 e σ = 1 la variabile aleatoria è detta standardizzata.

ue

3.15.2 Distribuzione del Chi Quadrato an

La variabile aleatoria Chi Quadrato non è altro che la distribuzione della somma dei quadrati di k

Em

variabili aleatorie indipendenti e distribuite normalmente. Questa distribuzione dipende da k ovvero

il numero di gradi di libertà (Figura 3.13.2.1). Questa distribuzione è utilizzata in econometria e in

statistica per effettuare test d’ipotesi relativi alla varianza campionaria, infatti è una distribuzione

non negativa.

Possiamo sintetizzare le caratteristiche di questa variabile aleatoria come segue:

i) Il valor medio di un Chi quadro con k gradi di libertà e pari a k mentre la varianza è pari a 2k;

ii) Se ho due variabili aleatorie che si distribuiscono come un Chi quadrato rispettivamente con k

1

! 2 1 2

e k gradi di libertà; la somma di tali variabili si distribuisce ancora come un con k + k

2

gradi di libertà;

iii) La distribuzione Chi Quadro è asimmetrica e il suo grado di asimmetria dipende dal numero di

gradi di libertà: maggiore è tale valore minore è l’asimmetria. Da questo si deduce che per k →

!

2 tende ad una distribuzione Normale.

∞ il

3.15.3 Distribuzione della t di Student ! 2

Il rapporto tra una Normale standardizzata e la radice quadrata del rapporto fra un e il suo

numero di gradi di libertà, si distribuisce come una t di Student se le due variabili aleatorie sono

indipendenti (in probabilità). Questa distribuzione è funzione dei suoi gradi di libertà ed in

particolare al crescere di questi tale variabile casuale tende ad una Normale (per K > 60 la t di

Student è considerata una Normale). È utilizzata in econometria per le verifiche d’ipotesi quando la

non è nota la varianza dei residui.

Possiamo sintetizzare le principali caratteristiche di questa variabile casuale come segue:

i) La distribuzione è simmetrica intorno allo zero che è anche il suo valor medio;

ii) La varianza è pari a k/(k-2) dove k sono i gradi di libertà.

3.15.4 Distribuzione della F di Fisher

È facilmente dimostrabile che il rapporto tra due variabili aleatorie distribuite come un Chi

ti

Quadrato ciascuna divisa per il proprio numero di gradi di libertà, si distribuisce come una F di

o

un

Fisher se le due variabili aleatorie sono indipendenti. Questa distribuzione dipende dai gdl dei due

at

! 2 considerati ed è per questo che si indica con F .

k ,k

1 2 rb

pp

Tale distribuzione è di fondamentale importanza in econometria poiché è utilizzata per verificare

29

che in un determinato intervallo di tempo non vi sia cambiamento strutturale

Ba

di

A

Possiamo sintetizzare come segue le proprietà di questa distribuzione

la

i) La distribuzione è asimmetrica; ue

ii) Il suo intervallo di definizione va da -∞ a +∞; an

Quasi sempre si suppone che il campione con il quale si effettuano le stime sia omogeneo ovvero si

29

suppone che non vi sia stato un cambiamento strutturale. Tuttavia questo avviene spesso in economia, ne

Em

sono esempi l’ingresso dell’Italia nell’Euro nel 1999, l’unificazione della Germania (1991) il che comporta il

cambiamento nel modo di produrre e nel modo di consumare, altro esempio è relativa al deposito previo che

vi fu all’inizio degli anni ’70 in Italia (in particolare in questi anni si importava molto e si esportava poco

quindi la bilancia commerciale era molto sfavorevole, queste condusse il governo a promulgare questo

istituto: l’importatore doveva depositare per un certo periodo di tempo in Banca d’Italia la stessa quantità di

denaro che avevano utilizzato per effettuare l’importazione).

iii) Al tendere ad infinito dei suoi gradi di libertà tale distribuzione tende ad una Normale;

iv) La distribuzione con k = 1 e k 0 k gradi di libertà è una t di Student con k gradi di libertà.

1 2 ti o

un at

rb

pp Ba

di

A la

ue

an

Em

4. L

A PROIEZIONE

4.1 Proiezione e proiettore nei modelli lineari

Riconsideriamo il modello lineare semplice che supponiamo essere specificato e stimato

corretamente: y = µ + βx + u

t t t

e ci poniamo il problema di proiettare y fuori dal campione che percorre il tempo t = 1, 2, 3 …, n;

t

in altre parole vogliamo determinare y per h = 1, 2, … n dove l’intervallo temporale n + 1, n + 2,

n+h 1

… n + n è detto periodo di proiezione. prima di addentrarci in questo nuovo argomento è

1

necessario fare le seguenti precisazioni:

i) Prima notazione - Nella pubblicistica (ovvero i media) la previsione è fatta con dei modelli

1

econometrici (in realtà tali modelli sono noti propio perché utili ad effettuare delle previsioni

che devono essere considerate come dati non certi);

ii) Seconda notazione - In seguito parleremo di errore della previsto che sarà la differenza fra la

previsione e quello che effettivamente si verifica. Tuttavia non si tratta di un vero e proprio

errore ma dipende dal fatto che sulla base di determinate considerazioni si è preferito dare un

certo valore rispetto ad un altro;

iii) Terza notazione - In generale si parla di previsione ma in realtà sarebbe più corretto parlare di

proiezione, infatti l’economista proietta il passato sul futuro ovvero trae il comportamento del

futuro dal comportamento del passato. La previsione è una componente aggiuntiva in quanto

consiste in una proiezione modificata a discrezione dell’econometrico il quale aggiunge a

questa dei concetti e delle variazioni di carattere qualitativo originando la sua previsione. In

particolare in alcuni casi le previsioni (basate su un praticare modello concettuale) sono molto

più corrette delle proiezioni. ti o

un

Per proiettare y facciamo le seguenti supposizioni:

t at

2

i) La struttura dell’economia è considerata invariante sia nel periodo di stima , sia nel periodo

rb

pp

successivo ovvero quello relativo alla proiezione. In altre parole stima supponendo che la

Ba

struttura economica rimanga la stessa nei due periodi rendendo così possibile l’utilizzazione

di

A

delle stime anche nella proiezione (infatti l’equazione utilizzata per effettuare le proiezioni è

quella stimata per il passato). Questa ipotesi risulta essere abbastanza restrittiva in economia (lo

è di meno quando la stessa è utilizzata in fisica o in tecnologia): ad esempio se avessimo

la

proiettato nel futuro un’equazione che considerava come variabile il prezzo del greggio

ue

avremmo commesso un grosso errore in quanto, per una modifica nella struttura di produzione e

di vendita del petrolio prima inimmaginabili, il prezzo del greggio si è notevolmente ridotto. Vi

an

possono essere anche dei casi in cui i cambiamenti strutturali sono prevedibili quindi è facile

tenerne conto nell’equazione utilizzata per la proiezione, cosa che non può essere fatta quando

Em

non si hanno queste informazioni;

La previsione è di fatto una delle cose marginali che fa l’econometria.

1 In particolar modo se vi è un cambiamento strutturale dobbiamo tenerne conto dopo aver fatto una verifica

2

d’ipotesi.

ii) Si ipotizza che i residui nel futuro abbiano le stesse caratteristiche supposte nel periodo

campionario, infatti si suppone che:

iii) Un’altra ipotesi che vien fatta fa riferimento al fatto che i residui del futuro, non solo siano

incorrelati fra loro, ma siano anche incorrelati con i residui del passato (ovvero i residui del

campione);

iv) i valori dell’esplicativa x per i tempi t = n + 1, n + 2, …, n + n siano noti.

t 1

Per l’ipotesi iii) risulta “naturale” prendere come proiezione dei residui il loro valor medio pari a

3

zero , per tale ragione si definisce proiezione la seguente equazione:

^ ^ 4

dove β e µ sono le stime fatte in precedenza sul campione e non nel periodo di previsione ;

x è il valore della variabile esplicativa nel tempo n + h.

n+h

Le componenti µ e βx costituiscono quella che viene definita parte sistematica del modello,

n+h

mentre il residuo è detta parte aleatoria. Nella definizione di proiezione non si fa alcun accenno a

y^ non è tanto la proiezione di y , quanto

quest’ultima componente quindi da questo si deduce che n+h t

la proiezione della sua sola parte sistematica (visto che abbiamo posto la parte aleatoria

arbitrariamente pari a zero). In altre parole quando si effettua una proiezione non si proietta il valore

intero ma solo la parte sistematica della variabile considerata.

Questa procedura, tuttavia, può essere giustificata in senso probabilistico se si considera la

ti

proiezione di una variabile aleatoria come suo valor medio come fece Bruno De Finetti il quale

o

un

intendeva la proiezione come valor medio di una certa distribuzione e solo in questo caso si può

at

accettare che la proiezione del residuo sia pari a zero. rb

pp

^ ^

Se nella relazione precedente β e µ vengono considerati come stimatori e non come stime allora

y^ Ba

diviene una variabile aleatoria che chiamiamo proiettore della parte sistematica di y .

di

n+h n+h

A

Le proiezioni soffrono di grande incertezza quindi nella definizione di queste si devono indicare le

la

possibili origini di incertezza: ue

i) Incertezza dovuta al residuo - Nella proiezione supponiamo che i residui sia pari al loro valor

medio, ma con ogni probabilità questa potrebbe non essere pari a tale valore;

an

Em

Nella definizione di proiezione si suppone che il residuo non ci sia o meglio che sia pari al suo valor medio:

3

questo non vuol dire che in un determinato tempo il residuo sia pari a zero.

È per questa ragione che supponiamo che la struttura del periodo di stima sia la stessa nel periodo di

4

previsione: utilizziamo infatti delle stime fatte nel periodo campionario nel periodo di proiezione.

ii) Incertezza dovuta al fatto che abbiamo supposto che nel futuro non vi sia un cambiamento

^ ^

rispetto al passato - Abbiamo considerato come parametri β e µ stimati nel periodo

campionario, tuttavia è possibile che tali valori non sia quelli del futuro;

iii) Incertezza derivante dalla variabile esplicativa supposta nota - Generalmente, infatti, quando si

ha la possibilità di stimare un modello con più equazioni, si cerca di prevedere anche tale

variabile esplicativa quindi si sostituisce a x una sua proiezione (anch’essa con un dato

n+h

livello di incertezza).

Considerando queste, e altre, fonti di incertezza si valutano più correttamente le proiezioni che si

5

ottengono .

4.2 L’errore di proiezione

A meno di non accettare l’impostazione di De Finetti, il proiettore non è uno stimatore non distorto

di y ma lo è la sua parte sistematica. Esso, tuttavia, può essere considerato non distorto in un altro

n+h

senso il quale si può illustrare facendo ricorso alla definizione di errore di proiezione

Si definisce errore di proiezione la differenza fra la proiezione e il dato effettivamente verificatosi,

esso è pari a:

dove u è noto visto che l’errore di proiezione viene determinato a posteriori

t+h

u^ è supposto nullo;

n+h

x è il valore della variabile che si è effettivamente verificato al tempo n + h.

n+h

L’errore di proiezione è funzione del residuo futuro del modello u il quale può essere visto come

n+h

variabile aleatoria, da questo deriva che anche e è una variabile casuale dalla quale possiamo

n+h

determinarne la media: ti o

un at

^ ^ ^ ^ ] sono pari a zero;

dove β e µ sono non distorte allora E(µ - µ ) e E[(β - β )x n+h rb

pp

E(u ) = 0 per ipotesi.

n+h Ba

di

A

Questa proprietà è molto simile alla proprietà di non distorsione, tuttavia non possiamo parlare di

non distorsione poiché abbiamo arbitrariamente posto pari a zero il residuo future della proiezione.

Quindi di fatto non proiettiamo esattamente y ma ne proiettiamo la sua parte sistematica, quindi

t la

questa non distorsione non riguarda l’interno y ma la sua parte sistematica. Questa proprietà è detta

t

non distorsione incondizionata e il proiettore (ovvero la proiezione vista in forma stocastica) è detto

ue

incondizionatamente non distorto.

Come abbiamo detto l’errore di proiezione può essere visto in termini stocastici (in particolare

an

^ ^ u^ dando così origine al

quando è espresso in in termini di stimatori β e µ oltreché di residuo n+h

y^

Em

proiettore; è invece inteso in senso matematico se è la proiezione e x è noto.

n+h n+h

Le proiezioni sono largamente utilizzate dal governo italiano per redigere il DEF - Documento di Economia

5

e Finanza.

Per ricollegarci alle applicazioni pratiche va detto che una delle variabili che si presta bene ad

eventuali proiezioni è il tasso di cambio, ciò non avviene con i consumi in quanto tale variabile

economica è di difficile previsione. In generale le variabili della contabilità nazionale sono facili da

proiettare anche se vi sono delle eccezioni: le esportazioni e gli investimenti (quest’ultima variabile

non è semplice da proiettare).

4.3 Proiezione ex ante o ex post

Possiamo distinguere la proiezione in proiezione ex ante e proiezione ex post, in particolare se la

variabile esplicativa x (o le variabili esplicative), e quindi anche le y , è nota allora abbiamo

n+h n+h

una proiezione ex post, al contrario avremo una proiezione ex ante.

In generale la proiezione che viene effettuata è una proiezione ex ante in quanto non abbiamo

alcuna informazione relativamente al futuro, è anche vero però che talvolta questa è fatta a

posteriori in quanto si vuole conoscere il funzionamento della stessa. In quest’ultimo tipo di

proiezione siamo a conoscenza di tutti gli elementi del modello, ed è questa l’unica differenza

rispetto alla proiezione ex ante che in termini analitici è simile a questa. L’importanza di questa

della proiezione ex post sta nel fatto che questa consente di verificare la bontà del metodo di

proiezione e dà dei risultati accettabili o meno. Un’altro fondamentale utilizzo della proiezione ex

post consiste nel sostituire i dati mancanti con questo metodo, si tenga presente che la maggior parte

dei programmi di calcolo riesce a calcolare i dati mancanti di una serie sostituendoli con dati fittizi

che hanno caratteristiche simili a quelle degli altri dati.

4.4 La proiezione con criterio dei minimi quadrati

La proiezione è fatta tramite l’utilizzo di un modello nel quale è necessario stimare dei parametri

con l’utilizzo ad esempio del metodo dei minimi quadrati ed in questo caso si parlerà appunto di

proiezione dei minimi quadrati. Tale proiezione gode di alcune fondamentali proprietà che

permettono di considerare questo modello di stima, seppur semplice, come un modello che fornisce

risultati corretti: i proiettori individuati con le stime dei minimi quadrati sono BLU (Best Linear

ti o

Unbiased). Questo deriva dalle seguenti considerazioni:

un at

i) I proiettori sono in tutti i casi lineari - La proiezione è sempre fatta con un modello lineare;

rb

pp

ii) I proiettori sono non distorti - La non distorsione dovrebbe essere considerata come

incondizionata visto che stiamo proiettando non y ma la sua parte sistematica che è l’unica

n+h Ba

di

A

6

proiettile , infatti possiamo dire che:

iii) I proiettori sono ottimi - Per l’ottimalità del criterio dei minimi quadrati applicato alle

la

proiezioni si dimostra essere valida una proprietà molto simile a quella valida per gli stimatori

ue

dei minimi quadrati: presa una combinazione lineare qualsiasi delle stime dei minimi quadrati,

si dimostra che la varianza di questa è inferiore rispetto a quella di una combinazione lineare

an

con gli stessi pesi di stime fatte con un qualsiasi altro metodo. In questo caso specifico

prendiamo c = 1 e c = x ottenendo:

1 2 n+h Em

Questo deriva dal fatto che in econometria non ha importanza il dato in se ma la parte sistematica di una

6

serie di dati: l’analista non è interessato a valutare quello che è accaduto in un dato anno o periodo (parte

aleatoria). Tale parte sarà considerata solo nel momento in cui vogliamo confrontare la parte sistematica con

la parte aleatoria ad esempio per dire che un determinato anno è stato un anno differente dagli altri (in questi

casi si valuta comunque prima la componente sistematica).

Questo spiega l’importanza del metodo dei minimi quadrati che per certi versi è il migliore.

4.5 L’errore quadratico medio di proiezione

Abbiamo già visto che l’errore di proiezione, dato dalla differenza fra il dato proiettato e quello

effettivo, può essere considerato in ambito stocastico come una variabile aleatoria e quindi, oltre a

determinarne la media, possiamo calcolarne la varianza. La radice quadrata di tale varianza prende

il nome di errore quadratico medio di proiezione.

Minore è la varianza e minore sarà l’errore di proiezione, e in particolar modo se questa è pari a

zero l’errore di proiezione è pari a zero quindi la proiezione è proprio pari al valore effettivamente

ottenuto. In altre parole possiamo considerarla come un indicatore della precisione della proiezione.

Quando il proiettore viene ottenuto con il criterio dei minimi quadrati, esso gode

di un’ottima proprietà poiché vale il teorema fondamentale della proiezione, che è il seguente:

^

^ sono gli stimatori dei minimi

e µ

Tra tutti i proiettori lineari e non distorti incondizionatamente se β

quadrati il proiettore costruito con questi è quello che possiede errore quadratico medio minimo.

4.6 Intervalli di confidenza per le proiezioni

Si è visto che esiste una certa simmetria tra le stime e le proiezioni, infatti in ambito stocastico i

primi divengono stimatori e i secondi proiettori. Questa simmetria continua anche nell’ambito degli

intervalli di confidenza il che ha una particolare rilevanza per le proiezioni: in genere si preferisce

ti

una proiezione intervallare piuttosto che una puntuale. o

un

La stima intervallare non è individuata solo per l’errore di proiezione (centrato in zero), ma anche

at

per la proiezione (localizzato in un altro valore). Prima di passare alla stima intervallare per la

proiezione ripetiamo cosa avveniva nel caso dello stimatore: rb

pp

i) Definire la probabilità dell’intervallo di confidenza (ad esempio 95%);

Ba

di

A

2 2

ii) Determiniamo z’ e z’’ (nel caso in cui σ era noto) oppure t’ e t’’ (nel caso in cui σ non era noto

ma doveva essere stimato ad esempio con la stima campionaria);

la

iii) Vi è poi la standardizzazione e la definizione dell’intervallo di confidenza.

ue

Stessa cosa vale nel caso della proiezione in particolare:

an

Em


ACQUISTATO

1 volte

PAGINE

133

PESO

10.85 MB

AUTORE

iNymph

PUBBLICATO

+1 anno fa


DETTAGLI
Esame: Econometria
Corso di laurea: Corso di laurea magistrale in finanza e assicurazioni
SSD:
A.A.: 2015-2016

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher iNymph di informazioni apprese con la frequenza delle lezioni di Econometria e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università La Sapienza - Uniroma1 o del prof Carlucci Francesco.

Acquista con carta o conto PayPal

Scarica il file tutte le volte che vuoi

Paga con un conto PayPal per usufruire della garanzia Soddisfatto o rimborsato

Recensioni
Ti è piaciuto questo appunto? Valutalo!

Altri appunti di Corso di laurea magistrale in finanza e assicurazioni

Appunti Valutazione d'azienda
Appunto
Appunti di Finanza matematica
Appunto
Riassunto esame Scienza delle Finanze, prof. indefinito, libro consigliato Economia del Settore Pubblico, Stiglitz
Appunto
Appunti Informativa, governance e controlli in banche e assicurazioni
Appunto