vuoi
o PayPal
tutte le volte che vuoi
Introduzione ai Modelli Statistici
Modelli statistici probabilistici e matematici che permettono di esplicitare la relazione tra variabili statistiche.
Si cerca un compromesso: un modello deve essere sufficientemente semplice per essere interpretabile ed utilizzabile ma non troppo semplice per riuscire ad avvicinare la realtà.
Es: prevedere il numero di sinistri di un assicurato sulla base delle sue caratteristiche individuali.
Variabile risposta:n° sinistriVariabile esplicativa:caratteristiche individuali.
Dobbiamo studiare come la variabile risposta è influenzata da quella/e esplicativa/e.
Passaggi Fondamentali
-
Specificazione del modello:
Il modello viene specificato sulla base di variabili d'interesse, relazione tra variabili risposta e studio metodologico di Ft.
-
Stima del modello:
I parametri del modello vengono stimati sulla base dei dati osservati.
-
Verifica e diagnosi di modello:
- Bontà del modello
- Significatività coefficienti
- Ipotesi e realistiche
-
Utilizzo del modello:
Per fare stima e previsioni delle quantità d'interesse.
Tipi di Modelli
- Semplice (1 var. risposta, 1 var. esplicativa)
- Multipla (1 var. risposta, più var. esplicative)
- Multivariata (più var. risposta, più var. esplicative)
- Lineare: la risposta è una combinazione lineare di esplicative e parametri
- Non-lineare: modelli per cui non esiste una trasformazione che li renda lineari
Modello di regressione lineare semplice
Yi = B0 + B1Xi + Σi
X = altezza madre
Y = altezza figlia
Ogni (Xi, Yi) è un punto nel piano
Coefficiente di correlazione
Sxy / SxSy
Coefficiente diregressioneB1 = ΣiuiYi
Assunzioni sulla distribuzione Σ
- ε(Σi) = 0
- Cov(Σi, Σj) = 0
Altre assunzioni sulla variabile esplicativa
- Consideriamo Xi fissa, non aleatoria
- Per le unità statistiche del campione considerato
Verifica del modello
Test d'ipotesi su β₁ e β₀ (significatività dei coeff di regressione)
Per β₁:
- H₀: β₁ = 0
- H₁: β₁ ≠ 0
Statistica test:
b̂₁ = b₁ H₀ = 0
s ⁄√wx √wx
Se(b̂₁) ∼ tn−2
Zona accettazione: {t: t wn−2; α⁄2 < t < twn−2; 1−α⁄2}
P-value 2×(1-p(t|toss, m−2|))
Rifiuto H₀ se p-value30) posso approssimare t con z
Per β₀:
- H₀: β₀ = 0
- H₁: β₀ ≠ 0
Statistica test:
b̂₀ = b₀ H₀ = 0
γ² ⁄√x x̄x̄ √x̄ x̄
Se(b̂₀) ∼ tm−2
Zona di accettazione e p-value: uguale che per β₁ P-value: 2×(1-p(t|toss, m−2|))
Intervalli di confidenza per β:
β₀: b̂₀ ± ε wn−2, 1−α⁄2 x̄s ⁄√x
β₁: b̂₁ ± ε wn−2, 1−α⁄2 x̄s ⁄√x
Verifica bontà modello: Test d'ipotesi su R²
H₀: R² = 0
- H₁: R ≠ 0
Oss: R² = 0 ⟷ r² = 0 ⟷ b̂₁ = 0
Statistica test:
-sqreg⁄q
sqres⁄(n−2) ∼ Fn, m−2
Se Foss > F1−α, m−q−1 → Rifiuto H₀ Se Foss < F1−α, m−q−1 → Accetto H₀
P-value: 1×(1-p(t|toss, m−2|)) p-value < α → Rifiuto H₀ p-value > α → Accetto H₀
NB: Se rifiuto H₀ → non posso rifiutare il modello
Assunzioni Modello in Forma Matriciale
- Media errori nulla: E[ε] = 0
- Var(ε) =
- Assenza di multicollinearità Y = Xβ + ε
X ha rango pieno, ovvero rg(X) = k+1
Stima del Modello: Stima Coeff B
B^ che minimizzi S(B) = Σεi2
B^ = (X'X)-1 X'Y
Calcolabile solo se X ha rango pieno & assenza multicollinearità
Valori Fittati (Previsti)
Per ogni i posso calcolare i^
cioè i^ = H Y
Inoltre ε = (I - H) Y
Stima di σ2
Non corretto
Invece S2 =
Si Individuino gli Elementi di (X'X) Calcolabili
DR = 482.65
S2 =
(X'X)-1 =