Econometria

Name: Econometria
Rating: 4.0 (1 reviews)
Author: kika1994

Revisionato il 14/05/2026

di kika1994

Publisher

Vota 4,0/5 (1)

Contenuto verificato e approvato dal Team di Esperti di Skuola.net

Appunti di econometria basati su appunti personali del publisher presi alle lezioni del prof. Sembenelli dell’università degli Studi di Torino - Unito, Facoltà di Economia, …

Esame Econometria

Facoltà Economia

Dal corso del Prof. Sembenelli Alessandro

Università Università degli studi di Torino

A.A. 2016-2017

73 pagine

9 download

Appunto

Scarica

Estratto del documento

Econometria

Autore: Federica Andreani

Capitolo 1 – L'analisi statistica dei dati economici

Domande economiche

L’econometria è la scienza di usare la teoria economica e le tecniche statistiche per analizzare i dati economici al fine di:

Quantificare le relazioni causali tra variabili.
Prevedere l'andamento futuro delle variabili economiche.

I metodi econometrici sono utilizzati in molti campi dell’economia, quali la finanza, la microeconomia, la macroeconomia, il marketing e la politica economica. Molte decisioni economiche richiedono stime quantitative di come la variazione di una variabile influenzi un’altra variabile. Esaminiamo varie domande quantitative tratte da problemi economici attuali:

Ridurre la dimensione delle classi migliora il livello di istruzione nella scuola primaria? Di quanto?
Vi è discriminazione razziale nel mercato dei prestiti per abitazioni?
Di quanto riducono il fumo le imposte sulle sigarette?
Qual è l’effetto sul PIL di una riduzione del tasso d’interesse da parte della BCE?

Ciò che accomuna le domande poste in econometria è la relazione causale tra variabili; nell’accezione comune causalità significa che un’azione specifica determina una conseguenza diretta, specifica e misurabile. Per farla semplice un fornello caldo causa un’ustione, bere acqua toglie la sete, fertilizzare piante di pomodoro (azione specifica) fa sì che queste producano più pomodori (conseguenza diretta misurabile).

Stima di effetti casuali

Qual è il modo migliore per misurare l’effetto sulla produzione di pomodori (in chilogrammi per metro quadrato) di una certa quantità di fertilizzante (100 grammi per metro quadrato)? Condurre un esperimento controllato casualizzato (randomized controlled experiment)!

In pratica si piantano pomodori in vari appezzamenti di terreno, ognuno dei quali è curato in modo identico, con una sola eccezione: alcuni appezzamenti ricevono 100 grammi di fertilizzante per metro quadro, mentre gli altri non ricevono nulla.

Perché controllato? Perché ci sono appezzamenti che non ricevono il fertilizzante (gruppo di controllo) e appezzamenti che lo ricevono (gruppo di trattamento). Perché casualizzato? Perché il trattamento (nel nostro caso il fertilizzante) è assegnato casualmente.

L’assegnazione casuale elimina la possibilità di una relazione sistematica tra altre caratteristiche (ad esempio l’esposizione al sole) e l’assegnazione a uno dei due gruppi, cosicché la sola differenza sistematica tra il gruppo di trattamento e il gruppo di controllo è il trattamento stesso.

Se dividessimo in due gli appezzamenti potremmo attribuire al fertilizzante un effetto che magari è dato dalla maggiore esposizione al sole (fattore di confusione) degli appezzamenti trattati rispetto a quelli non trattati. Quindi sarebbe necessario: econometria.

Gli esperimenti controllati casualizzati sono difficili da realizzare in un contesto di decisioni economiche, e più in generale in contesti sociali, perché spesso contrari all’etica, impossibili da realizzare in modo soddisfacente o proibitivamente costosi. Nonostante questo, il concetto di esperimento controllato casualizzato fornisce un riferimento teorico ideale per l’analisi econometria degli effetti causali tramite dati non sperimentali (osservazionali).

Dati: fonti e tipi

Abbiamo due tipi di dati: dati sperimentali e dati non sperimentali:

I dati sperimentali provengono da esperimenti disegnati esplicitamente per valutare effetti casuali tra variabili.
I dati non sperimentali (osservazionali) sono ottenuti osservando il comportamento reale al di fuori di un contesto sperimentale (questionari, indagine telefoniche, registri amministrativi, …).

Entrambe le tipologie si possono dividere in tre tipi principali:

Dati sezionali sono dati osservati su più unità statistiche diverse (lavoratori, consumatori, imprese, unità governative, …) per un solo periodo.
Serie temporali consistono di una singola entità osservata in più periodi.
Dati panel (dati longitudinali) consistono di più entità, ciascuna delle quali è osservata in due o più periodi.

Effetti causali con dati non sperimentali

1) Il problema delle variabili omesse

Si supponga di osservare in un campione di distretti scolastici una relazione negativa tra dimensione media delle classi e performance media degli studenti. È sufficiente per inferire che esiste una relazione causale?

No poiché non siamo certi che l’osservazione sia avvenuta in modo casuale; potrebbe essere che la performance migliore delle classi più piccole sia dovuta al collocamento territoriale, ovvero si trovano in zone in cui le condizioni economiche sono migliori (quindi esistono altre variabili che non vengono considerate).

2) Il problema della causalità simultanea

Si supponga di osservare in un campione di Stati nazionali una relazione negativa tra prezzo delle sigarette e consumo delle sigarette. È sufficiente per inferire che esiste una relazione causale?

No, in realtà non siamo neanche sicuri su quale tra le due sia la variabile causa e quale la variabile effetto. Ovviamente questi due problemi non risultano con i dati sperimentali.

Capitolo 2 – Richiami di probabilità

Individuato il fenomeno oggetto di studio, l'informazione disponibile è costituita dai seguenti oggetti:

Le unità statistiche: le singole entità su ciascuna delle quali il fenomeno è osservabile (es. intervistati).
Il carattere statistico: la quantità/qualità mediante la quale viene osservato il fenomeno.

Si dice popolazione statistica l'insieme delle unità statistiche sulle quali è possibile osservare il fenomeno.

→ Es. intervistati unità statistiche → intervistabili popolazione statistica

Indicheremo con:

Ω la popolazione statistica
l'unità statistica i-esima per i = 1, …, n e diremo che la popolazione ha n individui, anche se non rappresentano persone.

Individuata la popolazione bisogna determinare i caratteri che descrivono il fenomeno al meglio. Si dice carattere la grandezza che, misurata su ciascuna unità statistica, è rilevante per la comprensione del fenomeno. Affinché una carattere sia statisticamente rilevante è necessario che sia suscettibile di variabilità.

Caratteri e modalità

Modalità di un carattere: tutte le possibili determinazioni con cui può manifestarsi.
Modalità osservate: l'insieme delle determinazioni con cui il carattere si manifesta nelle unità statistiche osservate.

Ad esempio:

Fenomeno: capacità alberghiera a Torino
Popolazione: alberghi di Torino
Caratteri che rileviamo:
- N° posti letti: modalità ℕ = 1,2, …
- Dimensione ristornate in modalità ℝ [0, +∞)
- Quartiere in cui si trova l'albergo: modalità {Centro, Collina, …}

Un carattere si definisce qualitativo se le sue modalità sono espresse in termini di attributo mentre si definisce quantitativo se le sue modalità sono espresse in termini numerici o valori e in questo caso distinguiamo:

Discreto se le modalità sono individuate da un elenco.
Continuo se le modalità sono individuate da un intervallo.

Mutabili e variabili statistiche

Data una popolazione definito il carattere e l'insieme delle modalità M che questo può assumere, rileviamo il carattere su ciascuna unità statistica e otteniamo i dati che possono derivare dalle seguenti due procedure diverse:

Un censimento: descrizione dell'intera popolazione. Le metodologie forniscono esattamente le informazioni richieste ed è un procedimento lungo e costoso.
Un'indagine campionaria: consiste in una descrizione di un sottoinsieme della popolazione, chiamato campione.

Per fare affermazioni sull'intera popolazione servono metodologie inferenziali o induttive, ovvero che formulano conclusioni generali partendo da informazioni particolari; si ottengono approssimazioni del vero valore del carattere ed eventualmente una quantificazione dell'errore commesso.

La rilevazione dei dati determina una funzione che associa ad elementi della popolazione elementi di M (modalità). La funzione che associa a ciascun elemento di una popolazione una e una sola modalità in M si dice mutabile statistica (m.s.) se gli elementi di M sono attributi mentre si dice variabile statistica (v.s.) se gli elementi di M sono numerici. Inoltre, analogamente al carattere, le v.s. si distinguono in:

Discrete se M è un insieme discreto.
Continue se M è un intervallo.

Distribuzioni di frequenze

Data una popolazione di n unità, si consideri una m.s. o una v.s. X.

Definiamo dati individuali (o grezzi o disaggregati) di X l'insieme costituito dalle determinazioni delle unità statistiche, che indicheremo con {x_i}_i=1ⁿ, dove x_i è la modalità che il carattere assume per l'individuo i.

Ad esempio:

Carattere: età 1 ℕ
Esempio: {2, 21, 11}

Alcune modalità possono presentarsi più di una volta e, dunque, il numero di modalità distinte osservate sarà un certo numero K.

Per ogni modalità j, si definisce frequenza assoluta della modalità x_j il numero di volte in cui la stessa modalità è stata osservata sulle n unità statistiche, che indichiamo con f_j.

Si dice distribuzione di frequenze assolute di X l'insieme di coppie {(x_j, f_j)}_j=1^K.

Ad esempio:

X: inquadramento professionale
Ω: 10 dipendenti di un’azienda
M: {Manager, Tecnico, Amministrativo}
Dati individuali: {Manager, Tecnico, Manager, Amministrativo, Manager, Manager, Tecnico, Amministrativo, Tecnico, Manager}

Determiniamo la distribuzione di X:

Modalità distinte: {Manager, Tecnico, Amministrativo}
Frequenze assolute: {5, 3, 2}

Per costruzione della distribuzione la somma delle frequenze assolute è pari a n: f₁ + f₂ + … + f_K = n.

Ogni sintesi determina una perdita di informazioni. L'aggregazione dei dati in modalità e numerosità associate elimina l'informazione sulla corrispondenza tra singole unità statistiche e modalità. Dal punto di vista statistico, la perdita è irrilevante, ma è molto utile dal punto di vista pratico, se abbiamo due popolazioni di numerosità differente, il confronto delle frequenze assolute (riferite al medesimo carattere) non dà un’informazione significativa.

→ soluzione: introduciamo le frequenze relative.

Data una v.s. X con distribuzione di frequenza {(x_j, f_j)}_j=1^K, si definisce frequenza relativa della modalità x_j la quantità f_j / n, e la distribuzione {(x_j, f_j / n)}_j=1^K è detta distribuzione di frequenze relative o anche distribuzione di frequenza.

Per costruzione la somma delle frequenze relative è pari ad 1: f₁ / n + f₂ / n + … + f_K / n = 1.

Variabili aleatorie

Una variabile aleatoria (v.a.) o casuale è un numero il cui valore non è predeterminato ma dipende dall'esito di un esperimento.

Dato lo spazio campionario Ω con misura di probabilità P, si dice variabile aleatoria una funzione X, il cui dominio è Ω e il cui codominio è un sottoinsieme di ℝ. La funzione X associa ad ogni elemento ω ∈ Ω un solo valore x, tuttavia posso avere che ad eventi elementari diversi corrispondano realizzazioni identiche: X(ω₁) = X(ω₂) = x.

Esempio:

Ω = {HH, HT, TH, TT}
P(HH) = 1/4, P(HT) = 1/4, P(TH) = 1/4, P(TT) = 1/4
Associamo una scommessa all'esperimento data dalle seguenti regole:
Vinco 10 se HH
Perdo 15 se TT
Negli altri casi non vinco e non perdo

La vincita è un numero casuale, funzione dell'esito dell'esperimento. Definiamo una funzione X che ad ogni ω associa la vincita corrispondente:

X(HH) = 10
X(HT) = 0
X(TH) = 0
X(TT) = -15

Il valore di X è determinato da ω casuale e i valori che X assume, indicati con x_i, sono detti realizzazioni della funzione X. In questo caso abbiamo che: P(X = 0) = 1/2.

Sulla misura di probabilità P definita su Ω associo una probabilità ai valori che assume X, in particolare sommando la probabilità di eventi elementari che danno la stessa realizzazione:

P(X = -15) = 1/4
P(X = 10) = 1/4
P(X = 0) = 1/2

Riassumendo, la distribuzione di probabilità della v.a. X è:

X = -15, P = 1/4
X = 10, P = 1/4
X = 0, P = 1/2

Distribuzione di probabilità di una variabile casuale discreta

Una v.a. X si dice discreta se può assumere o un numero finito di valori o una quantità numerabile di valori {x₁, x₂, …}.

La probabilità che X assuma un particolare valore è indicata con P(X = x_i) = p_i. La distribuzione di probabilità di X o funzione di probabilità è data dalla collezione {(x_i, p_i), …}.

In pratica la distribuzione di probabilità di una variabile casuale discreta è l’elenco di tutti i possibili valori della variabile e delle probabilità con cui ciascuno di essi si verifica. Le probabilità, per costruzione, sommano a 1: Σp_i = 1.

Per le distribuzioni di variabili aleatorie discrete posso usare le rappresentazioni grafiche del tipo diagramma a segmenti o a barre per rappresentare la distribuzione stessa.

Facciamo un altro esempio: sia M il numero di volte che il computer si blocca mentre si sta scrivendo una tesina. La distribuzione di probabilità della variabile casuale M è l’elenco delle probabilità di ogni risultato possibile, la probabilità che M = 0, indicata con P(0), è la probabilità che il computer non si blocchi mai, M = 1, indicata con P(1), è la probabilità di un singolo blocco, e così via.

Risultato (numero di blocchi)	0	1	2	3	4
Distribuzione di probabilità	0,80	0,10	0,06	0,03	0,01
Distribuzione di probabilità cumulata	0,80	0,90	0,96	0,99	1,00

La distribuzione di probabilità cumulata (prende il nome di funzione di ripartizione) permette di calcolare la probabilità che X sia sotto una certa soglia; per esempio, la probabilità che ci sia al massimo un blocco è pari al 90% ed è la somma della probabilità di nessun blocco (80%) e di un solo blocco (10%).

Data una v.a. X con distribuzione, si definisce funzione di ripartizione (f.d.r.) di X la funzione F(x) che esprime la probabilità cumulata nell'intervallo (-∞, x]. Le probabilità cumulate hanno valore solo in corrispondenza delle realizzazioni di X. La funzione di ripartizione in generale per v.a. discrete è una funzione a gradini.

Anteprima

Vedrai una selezione di 16 pagine su 73