Modelli lineari
LMY = X β + ε dove ε ~ Nm (0, σ2I) → omoschedasticità, incorrelazione, non sistematicità X → matrice del disegno (l.n. non stocastica) β → matrice dei coefficienti Yi = X β + ε → i-esima risposta (i = 1, ..., m) → i-esima riga della matrice X E(Yi) = μi = X β = η risposta media media delle risp. predittore lineare Yi ~ N(μi, σ2) ∀ i (indipendenti e variate di i)
Limiti: Modelli LM
Se non c'è normalità della risposta → trasformo (log...) se buck la funzione è normale, ma non funziona sempre. Il problema sta poi nell'interpretare i coefficienti → vedi esponenziale Se non c'è omoschedasticità degli errori → vedi esponenziale Se il supporto della risposta non coincide con IR (ad esempio se è discreto, come una risposta dicotomica) Se non c'è linearità (Yi = f(xi1, ..., xik, β) + ε)
Modelli lineari generalizzati
Estendiamo gli LM in due direzioni:
- f non è lineare → μi non è uguale al predittore ηi → g(μi) = ηi link function NOTA, MONOTONA, DERIVABILE
- Non c'è la normalità → Yi ~ DEi
DEi → famiglie di dispersione esponenziale di ORDINE 1 (normale, bernoulli, binomiale, poisson, gamma, beta)
Osservazioni
LM e GLM con link function = g identificano Y e N Se y dicotomica → modelli di regressione logistica Se y conteggio → regressione poissoniana
Modelli lineari - LM
Y = Xβ + ε dove ε ∼ Nᵢ (0, σ²I) → omoschedasticità, incorrelazione, non sistematicità X = matrice del disegno (lire non stocastica) β = matrice dei coefficienti Yᵢ = Xᵢβ + εᵢ → i-esima risposta (i = 1,..., m) i-esima riga della matrice X E(Yᵢ) = μᵢ = Xᵢβ = m risposta media media delle risp. predittore lineare Yᵢ ∼ N(μᵢ, σ²) ⊥ (indipendenti & variare di i)
Limiti del modello LM
Se non c'è normalità della risposta ⇒ trasformano (log, ...) ed evete la normalità, ma non funziona sempre. Il problema sta poi nell'interpretare i coefficienti. Se non c'è omoschedasticità degli errori vedi econometria Se il supporto della risposta non coincide con IR (ad esempio se è discreto, come una risposta dicotomica) Se non c'è linearità (Yᵢ = f(xᵢ1, ..., xᵢk, β) + ε)
Modelli lineari generalizzati - GLM
Estendiamo gli LM in due direzioni:
- f non è lineare ➔ μᵢ non è uguale al predittore mᵢ ➔ g(μᵢ) = mᵢ link function NOTA, MONOTONA, DERIVABILE ≠ da E(g(Yᵢ)) = mᵢ media della trasformata
- Non c'è la normalità ➔ Yᵢ ∼ DE₁
DE₁ = famiglia di dispersione esponenziale di ORDINE 1 (normale, binomiale; insieme poisson - gamma beta)
Osservazioni
LM ⊂ GLM con link function = g identità e Y ∼ N Se y dicotomica ➔ modelli di regressione logistica Se y conteggio ➔ regressione poissoniana
Regressione logistica
Y dicotomica Y ∼ Be(Θ) Sy = {0,1}, f(y,Θ) = Θy(1 - Θ)1-y E(Y) = Θ Var(Y) = Θ (1-Θ)
Escluso di usare Mi perché: Distribuzione bernoulliana (non normale) Sy ≠ ℝ E(Yi) ≡ μi = Θi = Mi = Xiβ Θ ∈ (0,1) ∈ ℝ Non ha senso equiparare al Mi perché hanno supporti diversi
Linear probability model
Θi | | \0-------- x se k = 1
Constraint linear model
Θi | |______0-------- x
C'è omoschedasticità Negli Mi Yi = Mi + εi 1 2 μi N(0,σ2)
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
-
Appunti di Statistica III
-
Appunti di Statistica III
-
Appunti Statistica III
-
Appunti teoria Statistica