Capitolo 1: Models in science
Introduzione
La scienza si basa su modelli. I modelli sono una realtà virtuale che ci consente di rappresentare un pezzo di mondo reale in maniera semplificata e di comprenderlo in un modo migliore. Ad esempio, un modello è rappresentato dalla funzione del consumo, che è basata su una teoria. L’idea è che, per spiegare un fatto reale o un evento che si vuole cercare di comprendere, si formula una teoria, in questo caso che il consumo dipenda dal reddito. Successivamente la teoria implica un modello, che può o meno essere basato su aspetti matematici, solitamente lo è, ma non necessariamente deve esserlo. Ad esempio, nella funzione del consumo il modello matematico è: C = c * X. Questo tipo di modello, basato su una teoria secondo cui il consumo di una famiglia dipende dal suo reddito, è una realtà virtuale. Cioè, si crea o ci creiamo una realtà virtuale che ci consenta di spiegare un determinato fatto osservato.
Modelli scientifici come realtà virtuali
Oggi, grazie al computer, siamo abituati a vivere tante realtà virtuali, perché il computer è perfettamente in grado di creare realtà virtuali. Ad esempio, un documento in PDF può sembrare un libro dal punto di vista dell’immagine, ma di fatto non c’è alcun libro, si tratta di una realtà virtuale. Ci serve capire il concetto di realtà virtuale perché i modelli, di fatto, sono delle realtà virtuali che ci consentono di comprendere degli aspetti osservati nel mondo reale.
La Teoria Generale (General Theory) di Keynes è una teoria in cui di fatto non c’è nulla di matematica, ma introduce un’idea di modello, ossia il modello IS-LM. Quindi, la teoria generale implica un modello che è una realtà virtuale che consente di studiare come interagiscono i mercati dei beni e il mercato della liquidità. Questo è un flusso che parte da una teoria, che implica un modello, che, a sua volta, può essere visto come realtà virtuale e implica poi una determinata spiegazione di fatti realmente osservati.
Qualcuno potrebbe non essere soddisfatto dalla teoria di Keynes e quindi predisporre una teoria differente, che implichi un differente modello, che, a sua volta, produca una differente realtà virtuale con risultati differenti, quindi con una spiegazione di fenomeni reali osservati differente.
Il trasferimento di risorse avviene a livello di Cloud, cioè su internet, ma di fatto non c’è un passaggio materiale di soldi; c’è un vincolo dato dal mondo reale sul fatto che oltre una determinata soglia in cui si detengono soldi non si può andare, ma di fatto lo scambio avviene a livello di realtà virtuali. Ormai siamo abituati a reagire moltissimo con le realtà virtuali, che, tuttavia, a livello di scienza, servono per comprendere un fenomeno che vuole essere spiegato dalla scienza. Quasi tutte le scienze si poggiano sulle scienze e quindi su realtà virtuali.
Ad esempio, quando si fanno le “slides” di presentazione non c’è nessuna slide reale creata, ma è il computer che fa finta di rappresentare una slide, cioè che crea una slide virtuale, perché non esiste da un punto di vista reale. Dunque, esiste la teoria, che implica un modello, che, a sua volta, implica una realtà virtuale.
Modelli in economia
I modelli nell’ambito delle scienze economiche presuppongono la presenza di elementi casuali. Tuttavia, se si volesse provare a spiegare un determinato fenomeno, quel fenomeno in realtà o è stato osservato oppure non è stato osservato. Ovvero, quando nei modelli si inseriscono degli elementi di casualità (random elements), introducendo incertezza grazie a variabili casuali, il punto cruciale è semplice. La contraddizione è che se si vuole spiegare un fatto accaduto in passato, cosa che tipicamente intende fare la scienza, il fatto o è stato osservato, in questo caso è come se si dicesse che ha probabilità 1, oppure non è stato osservato, in questo caso è come se si dicesse che ha probabilità 0. Quindi non è necessario inventarsi una distribuzione di probabilità per tanti eventi in quanto in realtà ciò che si vuole andare a spiegare o si è verificato o non si è verificato.
Quando si introduce un modello di regressione, ciò che in realtà si vuole rappresentare è che la variabile che si vuole spiegare avrebbe potuto assumere un insieme infinito di valori con delle determinate probabilità. Se l’idea originale è quella di spiegare il perché è stato osservato un fatto non si può dire che ci sono un insieme di valori quando in realtà quel fatto o si è verificato o non si è verificato. Questo pone un po' di contrasto. La spiegazione che viene data è legata al fatto che in genere per le risposte dei comportamenti umani non si può conoscere tutto e quindi utilizzare degli elementi di probabilità aiuta a rappresentare questa parziale conoscenza del mondo e quindi anche se effettivamente non è appropriato, perché o un evento è stato osservato o non è stato osservato, in realtà è conveniente farlo.
Quando c’è una teoria, la teoria generale di Keynes implica un modello IS-LM. La teoria del consumo implica una funzione del consumo, che si chiama modello. Il modello è un insieme di data-generating processes (processo di generazione dei dati), o DGPs. Questo vuol dire che un modello è un qualcosa di generale, cioè associate ad un modello si hanno tante differenti realtà virtuali e per avere una singola realtà virtuale occorre che al modello, cioè al DGP, gli si attribuisca uno specifico valore.
Esempio: in questo modello di regressione lineare semplice: c’è una variabile indipendente y, una variabile dipendente x e una variabile casuale u (termine di disturbo). Questo è un modello, cioè un insieme di differenti DGP, perché a beta 1, a beta 2, ad x e ad u è possibile attribuirgli diversi valori. In funzione del valore che si attribuisce a questi parametri si ottiene una realtà virtuale, ma se si cambiasse anche solo beta 1 e si lasciassero invariati tutti gli altri parametri, si otterrebbe una differente realtà virtuale. Si parla di DGP (al singolare) quando si attribuisce uno specifico valore a tutte le variabili del modello e in questo caso si crea una specifica realtà virtuale. Se, invece, si parla di DGPs (al plurale), allora si ha un set (un insieme) di realtà virtuali definite ma non specifiche, in quanto non si sta attribuendo lo specifico valore al singolo parametro. Quindi, DGP sta per data-generating process e visto al plurale è un modello. Il DGP indica la relazione esistente tra la y e la x e quali variabili inserire, ma non fornisce il modello (DGPs). Se si vuole creare una singola realtà virtuale, si devono attribuire dei singoli valori ai parametri del modello.
Come facciamo a generare realtà virtuali?
Ogni computer contiene un generatore di numeri casuali (random number), che in genere produce numeri casuali da una distribuzione uniforme. Attraverso degli algoritmi quei numeri prodotti dal computer, che rispondono alla distribuzione di probabilità di tipo uniforme, vengono modificati per ottenere numeri da altre distribuzioni di probabilità. Questo consente ai computer di generare numeri casuali secondo differenti distribuzioni di probabilità. Essendo numeri prodotti da un computer, non sono pienamente random, infatti spesso si parla di pseudo random number, perché il computer, che li genera, non ha tutte le caratteristiche di randomness, cioè di piena casualità.
Econometria controfattuale
Spesso nella scienza, come nel caso dell’efficacia dei vaccini quando vengono utilizzati due diversi campioni, si crea una realtà controfattuale rispetto ad un determinato esperimento per verificare se poi successivamente ci sia la possibilità di discriminare tra chi ha avuto il vaccino rispetto ad un determinato evento. In econometria questo è molto complicato perché bisogna porre attenzione a come viene costruito il controfattuale, perché l’economia non è un qualcosa da esperimenti ma si tratta di dati di scienza sociali.
Esiste una distinzione tra:
- Modelli strutturali: quando si cerca di spiegare complessivamente una struttura di un fenomeno;
- Modelli parziali: quando si considera un piccolo aspetto e sulla base di questo si costruisce un modello. È chiaro che anche in questo caso c’è una struttura sottostante ma questo non è inteso come un modello strutturale.
Ad esempio, per prevedere le auto vendute in Italia si potrebbe:
- Creare un modello in cui si includono i consumi delle famiglie, l’andamento del PIL, l’andamento dell’inflazione, il prezzo della benzina, ecc., cioè in cui si include tutta una struttura rappresentativa di una realtà virtuale dell’economia italiana (modello strutturale);
- Oppure, più semplicemente, prendere un modello autoregressivo in cui si cerca di spiegare il prossimo valore con la storia passata mediante le recenti immatricolazioni di auto (modello parziale). In questo secondo caso è chiaro che si sta creando una struttura ma il modello è molto più semplificato, cioè non ha la pretesa di spiegare come si muova l’economia italiana ma solo di prevedere ciò che succederà al mercato delle auto nuove utilizzando i dati passati. Infatti, spesso i modelli econometrici o statistici non si riferiscono a modelli strutturali ma a modelli parziali, che hanno una struttura ma sono delle semplificazioni che riguardano degli aspetti molto limitati.
Capitolo 2: Modelli di regressione
Introduzione
Questo capitolo riguarda i modelli di regressione. Il punto finale del capitolo sarà quello di derivare uno stimatore, che è il metodo dei momenti, e, contemporaneamente, un altro stimatore, che sarà il metodo dei minimi quadrati. Per “stimatore” si intende una serie di procedure che consentono di ottenere un valore per dei parametri a noi sconosciuti, che intendiamo stimare. Per arrivare a questa parte finale bisogna innanzitutto presentare il modello e ricordare a noi stessi che cosa siano le variabili che entrano in un modello di regressione, cioè sono delle variabili casuali. Ripasseremo, quindi, cosa significa trattare le variabili casuali e quali sono le loro caratteristiche.
Il più elementare tipo di modello di regressione è il modello di regressione lineare semplice, che può essere espresso dalla seguente equazione:
Questo tipo di modello di regressione non è chiamato “semplice” perché ne esistono altri più complicati, ma semplicemente perché c’è una sola variabile esplicativa. Ossia, nell’equazione 2.01 vi è:
- Una variabile dipendente, y;
- Un’intercetta;
- Un coefficiente angolare;
- Una variabile indipendente (o esogena o esplicativa), x;
- Una variabile casuale, u, chiamata talvolta termine di disturbo (disturbance term) o termine di errore (error term). Tuttavia, la definizione di “error” non è del tutto appropriata, perché si potrebbe pensare che corrisponda ad un “errore”, ad un “mistake”, ma non è così; si tratta di un disturbo stocastico, quindi di una variabile casuale che viene inserita nei modelli.
La y è una variabile casuale perché la u è una variabile casuale. Nel modello di regressione lineare classico la x può essere addirittura una variabile fissa, cioè che assume valori fissi, e quindi non una variabile casuale, cioè che può assumere differenti valori. È sufficiente avere un termine di disturbo u, che è una variabile casuale, per avere una y che è anch’essa una variabile casuale.
Inoltre, nell’equazione 2.01 è presente un indice t, che è di solito usato per dati in forma di serie storica, mentre l’indice i è utilizzato per dati in forma cross section. Questi indici, i e t, rappresentano la specifica osservazione a cui ci si riferisce. Quando si ha un campione di osservazioni, relativo all’equazione 2.01, questo si riferisce a due dati, cioè un’osservazione corrisponde alla presenza di due dati: uno riferito alla y e uno riferito alla x. Per cui, è come dire che per t=1 si ha un’osservazione composta da un dato che si riferisce alla y, che è la variabile dipendente, e il corrispondente dato che si riferisce alla x, che è la variabile indipendente (o esogena o esplicativa). Le variabili y ed x variano in funzione dell’osservazione considerata. Questo lo si deduce dalla presenza del pedice t, che rappresenta appunto il fatto che y ed x variano in funzione dell’osservazione considerata.
I campioni di dati possono essere di 3 tipi:
- Dati in forma di serie storica, che sono una successione di numeri ognuna indicizzata dal tempo, cioè un’unità statistica osservata in un arco temporale più o meno lungo; Es.: numero di auto immatricolate in Italia: esce ogni primo giorno del mese (frequenza mensile) verso le 18:00 e mettendo insieme una raccolta di questi dati, per ogni mese si ottiene un singolo dato;
- Dati in forma cross section: si hanno più dati riferiti ad un singolo istante temporale, cioè si hanno più unità statistiche; in altre parole, sono dati in cui si “scatta una fotografia” in un istante temporale in cui sono presenti differenti unità statistiche. Es.: 1) PIL italiano, PIL tedesco, PIL americano, PIL francese in un dato anno: in 1 anno si hanno più unità statistiche; 2) il consumo di più famiglie in un determinato anno: più unità statiche, ciascuna delle quali rappresenta una famiglia, che costituiscono la dimensione del campione, tutte riferite ad uno stesso istante temporale;
- Dati in forma panel: si ottengono combinando la dimensione cross section e quella time series. Dunque, un campione di dati in forma panel ha 2 dimensioni: la dimensione cross section e la dimensione storica. Es.: 15 banche osservate per 3 anni: la dimensione cross section sono le 15 unità statistiche, corrispondenti alle 15 banche, ognuna per 1 banca; la dimensione time series sono i 3 anni (dati con frequenza annuale).
L’equazione 2.01 è composta da 5 elementi, dei quali 2 sono osservati, cioè la y e la x, e 3 non lo sono. Gli elementi x, y ed u sono riferiti in modo specifico all’osservazione t, mentre e sono costanti. L’equazione 2.01 può essere vista come un’equazione del consumo. L’idea è che c’è una teoria secondo cui il consumo dipende dal reddito disponibile, la teoria implica un modello, che potrebbe essere rappresentato dall’equazione 2.01, in cui: y è il consumo di una famiglia, è il consumo autonomo, è la propensione marginale al consumo ed x è il reddito disponibile di una famiglia. è chiamata funzione di regressione. è il consumo non osservato, che avrà la caratteristica di essere una variabile casuale.
Per avere identificabilità dell’equazione, cioè per poter stimare in modo univoco i parametri, è opportuno fissare il valore atteso della variabile casuale u pari a zero. In assenza di tale assunzione si potrebbero avere un’infinità di valori che permettono di risolvere l’equazione 2.01 e quindi sarebbe impossibile stimare l’equazione. Tale assunzione, invece, garantisce l’identificabilità dell’equazione. Spesso una giustificazione per introdurre un elemento di disturbo e modellarlo come una variabile casuale è il fatto che la nostra conoscenza su un determinato fenomeno è parziale. Quindi, ciò che non conosciamo e non riusciamo a spiegare perfettamente lo modelliamo come un termine di disturbo, che ha la caratteristica di essere una variabile casuale.
Togliendo la variabile casuale u, l’equazione 2.01 è l’equazione della retta, in cui è l’intercetta (o termine costante) e è il coefficiente angolare (slope).
Distribuzioni, densità e momenti
Immaginiamo di avere una variabile casuale, che è un modo solitamente utilizzato per rappresentare l’incertezza. Quindi, si definiscono una serie di possibili eventi ed a ciascuno evento si attribuisce una probabilità. Bisogna definire cos’è un evento, cos’è una probabilità e come si attacca questa probabilità all’evento.
Esempio 1: testa-croce in due lanci: gli outcomes, sia nel primo che nel secondo lancio, possono essere “testa” o “croce”. Si può essere interessati all’evento “due teste” oppure all’evento “due croci” in due lanci successivi di una moneta equa. Dunque, l’outcome è “testa” o “croce” ma l’evento a cui si può essere interessati è “due teste” o “due croci”. A quel punto si va ad attaccare una probabilità all’evento.
Esempio 2: lancio di un dado: lancio un dado e ho sei possibili risultati. Sono interessato all’evento “numero pari” oppure “numero dispari”. Quindi, gli outcomes sono le sei facce del dado, cioè i possibili risultati del lancio del dado, mentre l’evento a cui io sono interessata è il sottoinsieme (subset) “faccia 1, faccia 3 e faccia 5”, in questo caso si avrebbero numeri dispari, oppure “faccia 2, faccia 4 e faccia 6”, in questo caso si avrebbero numeri pari. A questi due sottoinsiemi si attribuisce una probabilità.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.