Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
BINOMIAL DATA
Esempio OPAPGS relazione Temperatura al lancio e rottura d'impulsi. Come la probabilità di fallimento è relativa alla temperatura in fase di lancio dello shuttle.
Il problema con il modello lineare è che la probabilità è e e (0,1) mentre i divieto formuel del modello non rispettano questi limiti. Una probabilità è traunca
valuta tra 0 e 1 ma non è credibile che le probabilità accettano 0 o 1.
Possiamo consideare y= no d'incidenti essera distribuito come una binomiale. Inatti il modello linearerichiede che gli errori si distribuiscano come una numeriaffandi l'inferenza se accicota. Questo non vale fin labinomiale (construo) plural nel nostro che ricavato non è costrutito caai sola il lancuato di anochiocistruit? Visiamo quindi come modello la REGRESSIONE BINOMIALE
Yi~Bin(Mi,p)
con Yi indeperenzit
P(yi=yi)= ( ni yi) = pyi * (1-p)ni-y
le pure individual che corpongono le risposte Yi sono tuesoffette aja resi il predicato: Xi1,...XipCovariate cess i giudoo di podadi arcni poueServe un modello che descriva la relazione tra X1, ... Xp ep Linear predicto:
Nin = B+XsXi+--+Xpg
Il predittor lineare pu' aseree compato le predttori qualetativie quantilatativi con l'uso di dinmies nostrie permette dicompere trasformazioni e combinazioni der predttori originalip è filexible ma interpretaterno.
Nel nostro caso, Mi = pi non è appropriato poiché 0 ≤ p ≤ 1.Usiamo la LINK FUNCTION g.
Mi = g(pi)
con g monotona e 0 ≤ g-1(n) ≤ 1 ∀ n.
Logit: η = log(p / (1 - p))
Probit: η = Φ-1(p) con Φ-1 è l'inversa della distr. N.
Complementary log-log: η = log(-log(1 - p))
La link function collega il predittore lineare alla media delle risposte.
- Stima dei parametri: metodo delle Massime Verosimiglianze (APPENDICE A).
Log Likelihood: l(p) = Σi=1n [ yi ηi - ni log(1 + eηi) + log(ni / ni!)]
max l(p) per stimare p̂
e Influenza
Modello più grande con l parametri e b1 likelihood
Modello più piccolo s parametri: LS è chi approssima un sotto spazio lineare (una restrizione lineare di parametri) del modello più grande.
Likelihood ratio statistic:
2 log (LG / LS)
Se per puntiamo al modello basta (quanti tanti parametri, quanti sono mini e che fitted values p̂i = ĝ-1(ηi)). Il test devianza:
D = 2Σi=1n [ yi log yi / ŷ + (ni - yi) log(ni - yi) / (ni - ŷ)]
con ŷi = fitted values del modello più piccolo.
Per modellare l'overdispersione si introduce un parametro di dispersione q2
Nel caso binomiale standard q2 = φ = 1. Stima dai dati:
q2 = χ2/n - p dove χ2 è quello di devianza
Lo stimatore di β2 non è affetto da q2, cambia la varianza:
Var(β2) = q2 (XTWX)–1 , l'errore standard va scalato di q2
Per confrontare modelli non si può usare le differenze in devianza perché la statistica test t non distribuisce χ2 con q2 sconosciuto.
Si usa la statistica F:
F = (Deviancesmall - Deviancelarge) / (dfsmall - dflarge) / q2
- Matched Case-Control Studies
Si cerca di determinare l’effetto di un certo fattore di rischio
sull’outcome. In un matched control study il college ogni caso
con uno o più controlli che hanno gli stessi valori
di alcune potenziali variabili che confondono. Si perde la possibilità
di determinare gli effetti delle variabili usate per il match
(es) il sesso). Inoltre, i dati non saranno un campione casuale
della popolazione di interesse.
Link function
si assume che E(Y) = μ (parametro medio) è collegata alla covariataattraverso il predittore lineare: η = g(μ).
Canonical link η = g(μ) = ϴ il parametro canonico.
Basta definire che g'(l(ϴ)) = ϴ.Ultimando questo XTξ è sufficiente per φ
- Normale η = μ Varianza 1
- Poisson η = logμ μ
- Binomiale η = log(μ/1-μ) μ(1-μ)
Fitting a GLM
I parametri: β possono essere stimati con la ML
L(ϴi,φ - yi) = wi[yiϴi - b(ϴi)+ c(yiφ)/φ]
Per le osservazioni indipendenti si ha ϴ.
- Dritto
Si usa una ottimizzazione numerica per ottenere β: il metodo Newton-Raphson con Fisher scoring, applicato, dimostra che l'ottimizzazione è equivalente a (IRWLS) iteratively reweighted least squares:
η = g(μ) * con μ = E(Y)
Espansione: g(y)≈g(μ)+(y-μ)g'(μ) = η+(y-μ) dη/dt ≡ z
IRWLS procedure:
- Valori iniziali η e μ0
- z0 = η+(y-⊂μ)dη/dtμ0 predittore
- Pes. W-1:
dη
(dη/dt)μ0 V(μ0)
4. Stime di β per ottenere η1
5. Ripetizione fino a convergenza.
Stima della varianza: Var(Ż) = (XTWX)-1 φ
Nel modello bionomiale φ = 1, in quello gaussian φ = σ2
Se assumiamo per l'effetto random β ~ N(0, σ²D), allora
Var(Y) = Var(Zβ) + Var(ε) = σ²Z D ZT + σI, possiamo scrivere
le distribuzioni non condizionate: y ~ N (Xβ, σ²(I + ZDZT))
Se consideriamo possiamo stimare β con il metodo dei minimi
quadrati generalizzati.
Chiamiamo V = I + Z D ZT la densità congiunta per la risposta è:
exp(− 1/2σ² (y − Xβ)T V−1 (y − Xβ))
2πm/2 | σ²V |1/2
log likelihood
l(β, σ, D|y) = − n/2 log 2π − 1/2 log |σ²V| − 1/2σ²(y − Xβ)T V−1(y − Xβ)
da cui possiamo stimatore MLE
Problemi: MLE è distorta β = Σi=1m (Xi − X̄)2/n mentre n
denominatore dovrebbe essere m−1.
Questo problema viene risolto con gli stimatori di max verosimiglianza
ristretti REML: l'idea è quella di prendere una combinazione
lineare della risposta Κ: Κ X = 0 > К y ~ N(0, К T Κ V К
si può massimizzare la verosimiglianza basata su Κ y che non
include i parametri degli effetti fissi. Una volta stimati i parametri
degli effetti random è semplice ottenere quelli degli effetti fissi.
- Inferenza
- Likelihood ratio test:
2 ( l(β̂, σ̂, D̂ | y, M) − ℓ(β̂, σ̂, D̂ | y) )
~ χ2
ipotesi alternativa ipotesi null
con gradi di libertà pari alla differenza di dimensione dei 2 spazi parametrici.
- Testare gli effetti fissi: non si può usare lo REML poiché
la combinazione lineare elimina gli effetti fissi. I valori, utilizzando
la ML ordinaria, tendono ad essere piccoli, si possono usare metodi
bootstrap oppure usare i test costruendo ripetuti ai valori
stimati degli effetti random.
- Testare gli effetti random:
H0: σ² = 0, se la χ2 di test tende
ad essere conservativo (p-valore più grande del dovuto).