Anteprima
Vedrai una selezione di 4 pagine su 15
Economia del lavoro Pag. 1 Economia del lavoro Pag. 2
Anteprima di 4 pagg. su 15.
Scarica il documento per vederlo tutto.
Economia del lavoro Pag. 6
Anteprima di 4 pagg. su 15.
Scarica il documento per vederlo tutto.
Economia del lavoro Pag. 11
1 su 15
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

VARIABILI STRUMENTALI

Il metodo IV è un metodo utilizzato quando non è possibile controllare per tutte le variabili rilevanti, e si sospetta che le stime OLS soffrano di omitted variable bias (OVB).

In tal caso, il termine d'errore dove vanno a finire le variabili omesse ma rilevanti, risulta essere correlato con la variabile trattamento di interesse, che si dice diventa una variabile endogena.

Talvolta saremo in grado di sfruttare delle particolari "forze della natura" detti esperimenti naturali che manipolano la variabile trattamento in modo simile ad un vero e proprio esperimento, fino a far venir meno la necessità di ricorrere a complesse, e magari non disponibili controlling strategies.

Nel metodo IV occorre considerare le seguenti variabili:

  • Zi variabile strumento
  • Di variabile trattamento
  • Yi variabile outcome

La variabile strumento (Zi) deve soddisfare 3 requisiti:

  1. Zi deve avere un effetto causale sulla variabile trattamento (Di). Tale effetto viene

definito First Stage

2) Zi deve essere assegnato in maniera random o almeno as good as randomly assigned. Questo requisito viene definito Indipendence Assumption

3) presenza di un unico canale attraverso il quale la variabile strumento (Zi) influenza la variabile outcome (Yi), quello che passa per l'influenza che Zi ha su Di. Requisito noto come Exclusion restriction.

Il primo link della catena è il First-Stage (effetto di Zi su Di), mentre il secondo link è il Second-Stage (effetto di Di su Yi). In virtù dell'ipotesi di indipendenza e dell'exclusion restriction, il prodotto tra First-Stage ("phi") e Second-Stage ("late") genera l'effetto della Zi su Yi (definito reduced-form ("rho")). Di conseguenza, arrangiando i termini si ottiene che il Second Stage è dato dal rapporto tra reduced-form (effetto di Zi su Yi ("rho")) e First-Stage (effetto di Zi su Di ("phi")).

Quindi, il LATE=E(Yi)

Dato Zi=1)-E(Yi dato Zi=0) / E(Di dato Zi=1)-E(Di dato Zi=0)

Al solito, possiamo stimare il first-stage, reduced-form e SecondStage, sostituendo i valori attesi di popolazione con i corrispondenti valori campionari ottenuti su un campione estratto casualmente dalla popolazione. In tal modo otteniamo uno stimatore, chiamato stimatore di IV. Quindi, siccome le stime IV sono ottenute da un campione occorre definire accanto alla stima anche gli standard error (i quali, permettono di definire la variabilità campionaria).

Tuttavia, le stime IV catturano l'effetto causale della frequenza alle charter per un gruppo specifico di soggetti sperimentali, chiamato compliers (soggetti che "obbediscono" al protocollo sperimentale, ovvero se Zi=1 Di=1 e se Zi=0 Di=0)).

Infatti, il metodo IV non è informativo dell'effetto causale per gli always-taker (soggetti che se Zi=1 Di=1 e se Zi=0 Di=1) e i never-taker (soggetti che se Zi=1 Di=0 e se Zi=0 Di=0). I defier (soggetti che

<p>se Zi=1 Di=0 e se Zi=0 Di=1) rappresentano un problema;infatti, nel caso in cui ci siano sia defier che compliers nei dati l'effetto medio dell'offerta della charter school potrebbe essere zero anche se in realtà tutti i soggetti beneficiano della charter school. Tuttavia, poiché il comportamento dei defier è raro nei protocolli sperimentali e IV possiamo assumere che sia assente (ipotesi di monotonicità di Zi). Quindi, il teorema del LATE ci dice che per ogni strumento Zi, sotto le ipotesi di monotonicità, di exclusion restriction e di First-Stage non nullo, il rapporto tra reduced-form e first stage è: LATE=” RHO” /” PHI” = E(Y1i-Y0i/Ci=1) dove Y1i Y0i sono i potenziali outcome, e Ci è una dummy che indica i compliers. Se siamo interessati non solo al LATE, ma anche all'effetto causale medio sull'intera popolazione, dobbiamo definire il TOT (Average Treatment effect on the treated): TOT= E(Y1i-Y0i</p>

Dato Di=1).Il TOT può essere diverso dal LATE a causa della presenza degli always-taker tra coloro con Di=1, e il treatment può avere effetto diverso tra gli always-taker e i compliers.

METODO 2SLS

Il metodo 2SLS generalizza le precedenti stime IV in due modi: 1) combina differenti strumenti per aumentare la precisione delle stime 2) consente di includere variabili di controllo e quindi mitigare il bias da strumenti imperfetti.

Cominciamo a riscrivere il first-stage e la forma ridotta come coefficienti di regressioni ausiliari:

Forma ridotta: Yi= α+ρZi+e0i

Fist-Stage: Di=α+φZi+e1i

Dove, ρ= E(Yi dato Zi=1) -E(Yi dato Zi=0) e φ= E(Di dato Zi=1)-E(Di dato Zi=0). Dunque, è possibile stimare il LATE come rapporto ρ/φ.

Sebbene il classico metodo IV e il metodo 2SLS producono la stessa stima del LATE, in pratica è preferibile utilizzare l’approccio 2SLS per evitare di commettere errori come, ad esempio, errori nel calcolo della corretta stima degli

standard error.

REGRESSION DISCONTINUITY DESIGN

La legislazione, ed altre norme e regolamenti, spesso vincolano il comportamento umano. Tali vincoli possono rappresentare delle situazioni quasi-sperimentali che gli economisti applicati sfruttano attraverso la metodologia denominata Regression Discontinuity Design (RDD).

Con riferimento all'esempio della Minimum Legal Drinking Age policy (MLDA) ci chiediamo qual è l'effetto di avere legalmente accesso all'alcol sui tassi di mortalità giovanili?

Identifichiamo le seguenti variabili:
1. Variabile trattamento (possibilità di bere legalmente) è data da Da dove Da=1 se a>=21, mentre Da=0 se a<21.
2. Running variable è la variabile che determina il treatment (nel nostro caso, la running variable è l'età misurata in mesi).
3. Variabile outcome, nel nostro esempio Ma (ovvero, tassi di mortalità ad età a).

In questo caso si parla di Sharp RD design, in quanto il

treatment cambia da 0 a 1 non appena la running variable supera la soglia istituzionale c (21 anni di età). Nella Fuzzy RD design il superamento della soglia aumento la probabilità di ricevere il trattamento o l'intensità del trattamento.

L'idea di fondo della RD design è che, mentre ci aspettiamo che la mortalità cambi in maniera continua rispetto all'età, un brusco balzo ("jump") nella mortalità attorno alla soglia a=21 è proprio da attribuire all'effetto causale della MLDA. In questo esempio, l'analisi RD è modello di regressione che include solo un termine lineare per la running variable:

Ma=alfa+pDa+ gamma(a-ao) +ea

Infatti, in questo modello non c'è bisogno di includere altre variabili di controllo che non siano la running variable, senza necessità di preoccuparsi di variabili omesse che possono essere correlate con la variabile trattamento dato che Da è, per costruzione.

solamente determinata dalla running variable a (unica variabile di controllo). In realtà, dobbiamo verificare che non vi siano differenze sistematiche in altre variabili di controllo per le osservazioni a sinistra e a destra della soglia, perché sia valida l'ipotesi che le osservazioni subito sotto possano rappresentare un buon controfattuale per le osservazioni subito sopra in assenza di trattamento. Sebbene, sia la RDD che le controlling strategies sono basati su modelli di regressione essi presentano delle differenze cruciali. Infatti, mentre le controlling strategies sono date dal confronto degli outcome medi tra i soggetti trattati e quelli non-trattati, a parità di variabili di controllo, per rendere la variabile trattamento "as good as randomly assigned", nella RDD per ciascun valore della running variable abbiamo solo soggetti trattati o solo soggetti non-trattati (mai entrambi) e l'unico modo per ottenere una sorta di confronto ceteris paribus dei.

trattati con i non-trattati è di farlo localmente, attorno alla soglia. Quindi, siamo disposti ad assumere che, in assenza del vincolo istituzionale, i soggetti con valori della running variable poco sopra la soglia non sarebbero stati poi così diversi da quelli poco sotto la soglia. Tuttavia, la relazione tra la variabile outcome (Y) e la running variable (X) non è sempre lineare. Di ciò si deve tener conto per poter identificare l'effetto causale del treatment D attraverso l'eventuale salto in corrispondenza della soglia istituzionale. Due strategie vengono tipicamente impiegate in ambito RDD per ridurre i problemi di errori di specificazione di cui sopra:

  1. introdurre direttamente nel modello di regressione la potenziale non linearità nella relazione tra la variabile outcome (Y) e la running variable (X), ovvero inserendo un polinomio in X nel modello di regressione (e non solo un semplice termine lineare).
  2. concentrarsi solo sulle osservazioni
subito a destra e subito a sinistra della soglia. Accanto a tale approccio definito parametrico, esiste anche un approccio non-parametrico: al fine di ridurre i problemi di identificazione dovuti alla presenza di trend non-lineari tra Y e X, questo approccio confronta gli outcome medi utilizzando solo le osservazioni in una piccola finestra appena sotto e appena sopra la soglia. Nell'approccio non-parametrico stimiamo un modello del tipo: Ma=alfa+pDa+gammaa+ea in un campione tale che: b-ao<=a<=a0+b dove b è la bandwidth (dimensione della finestra). Modelli RD non-parametrici sono tipicamente stimati usando il metodo dei minimi quadrati ponderati, una procedura che assegna maggior peso alle osservazioni vicino alla soglia e peso decrescente a quelle via via più lontane. Il peso è dato da una funzione specifica, chiamato Kernel. Scelte nella dimensione ottima della finestra nell'approccio non-parametrico: vi è un trade-off tra scegliere una finestra

piccola (cheriduce i bias dovuti ai trend non-lineari) e una finestra più grande(che, aumentando il numero di osservazioni che si usano, aumentala precisione delle nostre stime).

DIFF-IN-DIFFNon è sempre facile trovare strumenti credibili per analisi IV, orilevanti discontinuità di policy per analisi RDD, e allora occorrericorrere ad altri metodi di inferenza causale. Il metodo diff-in-diff èutilizzabile per analizzare gli effetti di riforme/cambiamento dipolicy e altri “shock economici”, a patto di avere dati di tipolongitudinale e che siano valide alcune condizioni.

Il metodo diff-in-diff parte dal presupposto che, in assenza diassegnazione random, il gruppo dei trattati e quello di controlloprobabilmente differiscono in molti aspetti. Tuttavia

Dettagli
A.A. 2022-2023
15 pagine
SSD Scienze economiche e statistiche SECS-P/08 Economia e gestione delle imprese

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher nicola.navarra di informazioni apprese con la frequenza delle lezioni di Economia del lavoro e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli studi di Torino o del prof Devicienti Francesco Serafino M..