Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
Assunti di Gauss-Markov
1. Costanza: una variabile esplicativa (VI) è costante qualunque sia il valore assunto dalle altre variabili esplicative.
2. Non additività: la relazione tra la variabile dipendente (VD) e una variabile esplicativa (VI) varia in funzione dei valori delle altre variabili esplicative.
3. Assunti di Gauss-Markov che riguardano alcune caratteristiche formali del vettore dei disturbi o degli errori (ε):
- Il valore atteso di ogni ε è pari a 0.
- La componente d'errore ha media nulla, gli errori positivi e negativi si annullano se gli errori di misurazione non sono casuali.
- Errore non costante: una nuova variabile esplicativa può entrare nella stima del parametro della VD per correggere un errore sistematico.
- Assenza di autocorrelazione nel vettore degli errori.
vettore degli errori (ε) la covarianza deve essere nulla. Questo assunto ha a che fare con il campionamento, dovremmo avere a che fare con osservazioni indipendenti tra loro (campione casuale). Se i campionamenti non sono fatti in modo rigoroso può venir violato questo assunto, che provoca una distorsione della stima dei parametri. Questo assunto viene violato nel caso di serie temporali, negli studi cross-sectional si può avere violazione nel caso che le singole osservazioni abbiano una "struttura".
Omoschedasticità del vettore degli errori (ε) X, La varianza dell'errore deve essere costante al variare di si riferisce alla dispersione degli errori. Eteroschedasticità: la varianza degli errori varia al variare del livello X di 3.
LA FAMIGLIA DEI MODELLI LINEARI GENERALIZZATI deve essere continua. Nel modello lineare classico la variabile dipendente in notazione scalare può essere espressa come: X. Essendo le libere di assumere
qualsiasi valore, così come i parametri incogniti (θ), anche il singolo valore atteso (μ) potrà assumere qualsiasi valore compreso tra.
Nel caso di violazione dell'assunto di continuità, possiamo considerare la situazione opposta a quella di una VD continua che può assumere valori compresi tra => la VD può assumere soltanto due valori: 0 e 1.
In caso di VD dicotomica abbiamo diverse conseguenze:
- Il vettore dei valori attesi di y (μ) coincide con il vettore delle probabilità che y sia uguale a 1.
- I valori attesi devono essere compresi tra 0 e 1.
- Tenuta degli assunti. yI valori attesi sono dunque probabilità che sia uguale a 1. È possibile esprimere il valore atteso come speranza matematica.
Considerando il generico valore osservato (x), è possibile scrivere il corrispondente valore atteso (μ) così che indicando con la probabilità che il generico elemento del vettore sia uguale a 1, si ottiene: il
Il valore atteso di una variabile casuale discreta
La speranza matematica è (variabile che è soggetta a oscillazioni casuali ma che può assumere soltanto valori discreti).
Il valore atteso è dato dalla somma dei possibili valori di tale variabile, ciascuno mediato moltiplicato per la probabilità che si verifichi. In altri termini, è la ponderata dei possibili risultati.
I valori attesi devono assumere valori compresi tra 0 e 1 (assenza o certezza dell'evento).
Di conseguenza anche a destra dell'uguale deve essere rispettato lo stesso intervallo.
Alcuni degli assunti del modello lineare classico sono influenzati dalla presenza di una VD dicotomica, in particolare il primo e il terzo assunto di Gauss Markov:
Il valore atteso di ogni è uguale a 0
La varianza dell'errore è costante (omoschedasticità)
La tenuta o meno di questi assunti implica la presenza o meno di due importanti proprietà dei parametri stimati: correttezza
ed efficienza. Il primo assunto- tiene il valore atteso dell'errore quando siamo in presenza di una variabile categoriale, rimane pari a 0. Il valore atteso sarà sempre uguale a 0
Il terzo assunto- non tiene, è possibile dimostrare che la varianza della (x componente d'errore varia sistematicamente al variare dei valori )i delle variabili esplicative. La varianza dell'errore non è dunque costante (eteroschedasticità)
Possiamo quindi dire che le stime dei parametri che si ottengono in presenza di una VD dicotomica e di una specificazione lineare del modello sono corrette, ma non efficiente, non sono cioè le migliori ottenibili
3.1 Generalizzazione del modello classico
Per ampliare gli ambiti di applicazione del modello lineare classico è necessario procedere a una generalizzazione del modello.
stocastica strutturale
Mantenendo la distinzione tra componente e, possiamo indicare la componente strutturale con () e possiamo scrivere: E di
conseguenza:Il membro a sinistra dell'uguale (la componente stocastica) indica il vettore delle osservazioni, ma la presenza di ( ) ci ricorda che tali osservazioni vengono pensate come il risultato di un processo aleatorio: nel mondo probabilistico osserviamo ma se vivessi in un mondo deterministico non osserveremmo ( ), osserveremmo cioè ma i suoi valori attesi (Possiamo sostituire l'espressione ( ) con µ, ponendo così (L'uguale legame (link) componente strutturale la rappresenta il tra la ( ) e componente stocastica (µ). Nel caso dei modelli lineari classici si tratta di una relazione di identità. È possibile generalizzare il modello classico permettendo al legame di assumere forme diverse, variando il legame di identità il legami di tipo diverso. Questo passaggio permette di generalizzare il modelli lineare classico. Che diventa: g( ) funzione monotona Dove indica una generica differenziabile detta legame funzionale. In questoIn modo il modello lineare classico diventa un caso speciale della famiglia dei modelli lineari generalizzati. Le caratteristiche che lo rendono un caso speciale sono:
- g( ) è una funzione di identità
- La componente stocastica ha una distribuzione normale
I modelli lineari generalizzati permettono di usare legami funzionali differenti e di considerare componenti stocastiche diverse da quella normale (distribuzioni esponenziali).
La scelta del legame funzionale da utilizzare dipende dalle decisioni prese a monte dall'analisi dei dati, quando definiamo quale sarà la VD (la scelta dell'applicazione di un tipo di modello dipende da esigenze conoscitive, a quali domande si vuole dare risposta).
Quando la VD è una variabile categoriale, usiamo il modello logit.
Nel caso di scale di conteggi si utilizza il legame logaritmo.
Il tipo di VD posta con sé il tipo di aleatorietà. Una variabile continua distribuisce normalmente, hanno componenti
stocastichele variabili categorialicon distribuzioni differenti (poisson, multinomiale, binomiale, …)valori attesi variabili esplicativeNel modello lineare classico la relazione tra e èlalineare ( , che si può scrivere anche come ) , e lineare è ancherelazione tra la VD e le VI ( che in notazione scalare possiamo scriverecome ) yPer la linearità della relazione tra valori osservati della VD e le variabilixesplicative è possibile interpretare direttamente i parametri theta (θ):Il segno rappresenta la direzione dell’influenza Il modulo (valore assoluto) dei parametri indica l’entità dell’effetto delle VI sulla yL’effetto è proporzionale e costante al variare dei valori delle variabili esplicative (proporzionalità e additività)Ciascun termine (parametro e variabile) a destra del legame funzionale contribuisce in modo additivo a determinare il valore atteso della y4.LogaritmiInMatematica: il logaritmo di un numero in una data base è l'esponente al quale la base deve essere elevato per ottenere il numero stesso. Qualsiasi numero elevato a 1 è uguale a sé stesso. Il logaritmo di 1 è uguale a 0. La funzione inversa del logaritmo, l'antilogaritmo, è detta anche funzione esponenziale. Quando la VD è una scala assoluta, si ha un legame logaritmo. La variabile dipendente è frutto di un'operazione di conteggio, i valori osservati possono quindi essere solo interi positivi. Il legame funzionale logaritmo impone anche che i valori attesi siano sempre positivi. Ricavando µ si ottiene: la relazione è sempre lineare (proporzionale, costante, additiva), ma non tra i valori attesi di e le variabili esplicative, ma tra i logaritmi dei valori attesi e le variabili esplicative, cioè la combinazione mi permette di ricavare non più la variabile osservata ma.. y. La relazione tra valori attesi di p variabili.
esplicative non è più lineareE di conseguenzaIl legame funzionale logaritmo è particolarmente adatto per modelli basatisull'indipendenza della probabilità associate a dati, frutto di classificazioniincrociate che vengono detti log-lineari.
4.1 Legame funzionale logit
Utile per affrontare le spiegazioni di eventi di tipo qualitativo, come ad esempioi processi di scelta.
Quando la VD è dicotomica i valori attesi, definiti dalla parte strutturale delmodello ( ), devono essere anche loro compresi nell'intervallo 0-1 (il valoreatteso µ è una probabilità):
Tale compito viene svolto dal legame funzionale Logit:
Ricavando µ si ottiene:
Che in notazione scalare si può scrivere: è il rapporto tra la probabilità di rispondere 0 e 1,Il rapporto di probabilitàtra la probabilità che l'evento si verifichi e che esso stesso non si verifichi.yIl logaritmo di questa rapporto sarà la nostra
attesa (()) è la probabilità associata all'evento 1
µ è la probabilità associata all'evento 2-µ (contrario dell'evento 1)
La relazione lineare (proporzionale, costante, additiva) viene mantenuta fra logit dei valori attesi e le variabili (logaritmo del rapporto di probabilità) esplicative; VD e le VI non è lineare ma la relazione tra valori attesi della (non è dunque più possibile rappresentarla tramite una retta) tra valori attesi e la componente strutturale
La non linearità della relazione