Modello statistico
Un modello è uno schema teorico che si concentra sugli aspetti strutturali più importanti. Un modello statistico tiene conto della relazione tra teoria e dati, e ha due componenti: deterministica o sistematica (regolare) e casuale (rumore). I dati non seguono mai una espressione matematica esatta a causa dell'errore di misurazione e di campionamento (es: l'osservazione di Xi non binom su una retta perfetta).
In generale, un modello statistico è un modello per una variabile di risposta o dipendente yi:
Y = ft(xobs, xunobs) + uunobs
- ft: funzione non nota
- xobs, xunobs: variabili esplicative o indipendenti, osservate
- uunobs: errori causati dalle xunobs
Solitamente assumiamo un modello statistico lineare:
y = x'β + eunivariate
eunobs = β0 + β1x1 + ... + βkxk + etot
- β0, ..., βk: k+1 coefficienti di regressione
- β0: intercetta
- etot: componente casuale con distribuzione caso del 1più
Per modello lineare si intende lineare nei parametri, ciò che può essere ricondotto a lineare tramite trasformazioni:
y = β0 + β1x + e → y = β0β1x + e → ln(y) = ln(β) + ln(x(β) + ln(e))
La variabile spiegata può essere lineare mediante una funzione monotona, non perfetta frontiera.
y = β0 + β1c + e → ma non si può linearizzare x
Dato un campione di grandezza m assumiamo che la relazione valga per ogni unità campionaria!
yi = β1 + β2xi1 + ... + βkxik + ei, i = 1, ..., m
Modello statistico lineare classico
Un modello è uno schema teorico che si concentra sugli aspetti strutturali più importanti. Un modello statistico tiene conto della relazione tra teoria e dati, e ha due componenti: deterministica o sistematica (regolar) e casuale (Rumore). I dati non seguono mai una espressione matematica esatta a causa dell'errore di misurazione e di campionamento (ex. osservazioni di $i$ H non stanno su una retta perfetta).
In generale, un modello statistico è un modello per una variabile di risposta o dipendente $(i)$:
Y = f(×obs, ×unobs) = f(obs) + eunobs
- f1: funzione non nota
- ×obs, ×unobs: le variabili esplicative (regolare) e indipendenti e osservate
- εunobs: gli errori causati dalle εunobs
Solitamente assumiamo un modello statistico:
Y = ß0 + ß1 (×...)=1)
ß2 + ... + ßk xki + ei0
- k+1 coefficienti di regressione con ß0intercept
- ei: componenti casuali con distribuzione gaussiana
Per modello lineare si intende lineare nei parametri — cioè che può essere ricondotto a lineare tramite trasformazioni:
y = ß0 + ß1 x + ß2 t t d → y = ß0 + ß1 x + ß2 (z) + v (xi + e)
y = ß0 + ß1 t → ln(y) = ln (αβ): ß0 (xi) + ln (e) + Ο (yi → i)
y = ß0 + ß1 ×z t + e
Detta una cognizione di grandezza assumiamo che la relazione valga per ogni unità campionaria:
Yt μt β1 Zri+ unità componenti variabi | campioni di carattere
Assumere le condizioni classiche alle covarianze, gli errori obbediscono le proprietà:
- E(ei)=0 ∀
- Var(ei)=σ2 ∀i
- Cov(ei; ej)=0 ∀i≠j
Regressione lineare semplice
È il modello con una sola variabile esplicativa (xi)
yi = γ0 + γ1xi + ei, in cui:
- yi: la costante
- γ1: coefficiente angolare (pendenza)
- σ2: Var(cy): varianza residua
Dato che E(yi|x)=, allora:
y̅ = y0+ γ̂1x̅
Pendenza: parametro più importante del modello:
γ̂1 = E(yi|x)
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.