Binomial data
Esempio O.R.N.G.S.
Relazione temperatura al lancio e natura O-Rings. Come la probabilità di fallimento è relativa alla temperatura in fase di lancio dello shuttle. Il problema con il modello lineare è che le probabilità esistono in (0, 1), mentre i valori stimati dal modello non rispettano questi limiti. Una probabilità è truncata sull'asse tra 0 e 1 ma non è così per le probabilità che esattamente 0 o 1.
Possiamo considerare y=n° di incidenti distribuito come una binomiale. Inoltre, il modello lineare richiede che gli errori si distribuiscano come una normale affinché l'inferenza sia accurata. Questo non vale per la binomiale (con solo due prove) nel mettere la variabile non è assoluta così vuole l'espressione di autocorrelazione.
Usiamo quindi come modello la regressione binomiale
Yi = Bin(Mi, pi) con Yi indipendenti
P(Yi = yi) = MiCyi pyi (1-p)Mi-yi
Le variabili individuali che compongono le risposte Yi sono tutte influenzate dai predittori (Xi1, ..., Xiq). Covariata class = gruppo di prove. Serve un modello che descriva la relazione tra Xi1, ..., Xiq e p lineare predetto:
ni = β0 + β1 Xi1 + ... + βq Xiq
Il predittore lineare può essere composto da predittori qualitativi e quantitativi. Con l'uso di dummies inoltre permette di comporre trasformazioni a combinati dei predittori originali p è flessibile ma interpretabile.
Esempio OPACAS
Relazione temperatura al lancio e rottura d-ring. Come la probabilità di fallimento è relativa alla temperatura in fase di lancio dello shuttle. Il problema con il modello lineare è che le probabilità S e N sono limitate. I valori stimati dal modello non rispettano questi limiti. Una probabilità è troncata risultato tra 0 e 1 ma non è credibile che le probabilità siano esattamente 0 o 1.
Possiamo considerare y = n° di incidenti distribuito come una binomiale. Inoltre, il modello lineare richiede che gli errori si distribuiscano come una normale affinché l'inferenza sia accurata. Questo non vale per la binomiale (con solo 2 prove) nel nostro caso la variabile non è continua così vale l'assunzione di omoschedasticità.
Usiamo quindi come modello la regressione binomiale
Yi ~ Bin(Mi, pi) con Yi indipendenti
P(Yi=yi) = MiCyi(pi)yi(1-pi)Mi-yi
Le prove individuali che compongono le risposte Yi sono tutte soggette agli Xij predittori: q (Xi1, ..., Xiq). Covariata class = gruppo di prove. Serve un modello che descriva la relazione tra Xi1, ..., Xiq e p lineare predittor:
ηi = β0 + β1 Xi1 + ... + βq Xiq
Il predittore lineare può essere composto da predittori qualitativi e quantitativi con l'uso di dummies, mentre permette di compiere trasformazione e combinazioni dei predittori originali. p è flessibile ma interpretabile.
Link function
Nel nostro caso, i=i non è appropriato, poiché 0≤i≤1. Usiamo la link function g[i=-1(i)] con monotona e 0≤-1()i ≤1 ∀ . Tre scelte:
- Logit: i=loge ( / (1-))
- Probit: i=Φ-1 () con Φ-1 è l'inverso della distribuzione normale.
- Complementary log-log: i=loge(-log (1-))
La link function collega il predittore lineare alla media della risposta.
Stima dei parametri
Metodo delle massime verosimiglianze (APPENDICE A)
Log Likelihood:
L()=∑i=1n[-log(1+)+log(!/(!(-)!))]
Max L() per stimare ̂e Inferenza. Modello più grande con L parametri, e be Likelihood. Modello più piccolo S parametri. LS è chi-quadro. Rappresenta un sottospazio lineare (una restrizione lineare sui parametri) del modello più grande. Likelihood ratio statistic: 2log (LL / LS)
Se i funzione di modello basso (quindi tanti parametri quanto sono usati e he fitted values ̂ i=-1 (̂ i)):
Il test devianza:
D= 2∑i=1 [ilog ̂
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
-
Appunti Lezioni Econometria
-
Appunti di Econometria
-
Appunti schematici Econometria
-
Appunti completi Econometria