Introduzione ai Modelli Statistici
Modelli statistici probabilistici matematici che permettono di esplicare la relazione tra variabili statistiche.
Si cerca un compromesso: un modello deve essere sufficientemente semplice per essere interpretabile ed utilizzabile, ma non troppo semplice per riuscire ad avvicinarsi alla realtà.
Es: prevedere il numero di sinistri di un assicurato sulla base delle sue caratteristiche individuali.
- Variabile Risposta: nº sinistri
- Variabile Esplicativa: caratteristiche individuali
Dobbiamo studiare come la variabile risposta è influenzata da quelle esplicative.
Passaggi fondamentali:
Specificazione del modello:
- Il modello viene specificato sulla base di variabili d'interesse, relazione tra variabili, ipotesi, studio, metodologia di raccolta dei dati, pre-processing.
Stima del modello:
- I parametri del modello vengono stimati sulla base dei dati osservati.
Verifica e diagnostica del modello:
- Verificare se le assunzioni alla base del modello sono coerenti con i dati. Se così non fosse, dobbiamo ripartire da capo.
Utilizzo del modello:
- Per fare stima e previsioni delle quantità d'interesse.
Tipi di modelli
- Semplice (1 var. risposta e 1 var. esplicativa)
- Multipla (1 var. risposta più var. esplicative)
- Multivariata (più var. risposta, più var. esplicative)
- Lineare: la risposta è una combinazione lineare di esplicative e parametri
- Linearizzabile: modelli che possono essere resi lineari tramite opportune trasformazioni
- Non lineari: modelli per cui non esiste una trasformazione che li renda lineari
INTRODUZIONE AI MODELLI STATISTICI
Modelli statistici probabilistici matematici che permettono di esplicitare una relazione tra variabili statistiche.
Si cerca un compromesso: un modello deve essere sufficientemente semplice per essere interpretabile ed utilizzabile ma non troppo semplice per riuscire ad avvicinarsi alla realtà.
Es.: Prevedere il numero di sinistri di un assicurato sulla base delle sue caratteristiche individuali.
- Variabile risposta: nº sinistri
- Variabile esplicativa: caratteristiche individuali
Dobbiamo studiare come la variabile risposta è influenzata da quella esplicativa.
Passaggi fondamentali:
Specificazione del modello:
- Il modello viene specificato sulla base di variabili di interesse, relazione tra variabili, ipotesi, studi, metodologia di raccolta dei dati, pre-processing.
Stima del modello:
- I parametri del modello vengono stimati sulla base dei dati osservati.
Verifica e diagnostica del modello:
- Verificare se le assunzioni alla base del modello sono coerenti con i dati. Se così non fosse, dobbiamo ripartire da capo.
Utilizzo del modello:
- Per fare stima e previsioni delle quantità d'interesse.
Tipi di modelli:
- Semplice (1 var. risposta & 1 var. esplicativa)
- Multipla (1 var. risposta più var. esplicative)
- Multivariata (più var. risposta, più var. esplicative)
- Lineare: la risposta è una combinazione lineare di esplicative e parametri.
- Linearizzabile: modelli che possono essere resi lineari tramite opportune trasformazioni.
- Non lineari: modelli per cui non esiste una trasformazione che li renda lineari.
MODELLO DI REGRESSIONE LINEARE SEMPLICE
Yi = B0 + B1Xi + εi i = 1,...,n
- Y = ALTEZZA MADRE
- X = ALTEZZA FIGLIA
OGNI (xi, yi) È UN PUNTO NEL PIANO
COEFFICIENTE DI CORRELAZIONE
⁄ ∈ [-1,1] = rxy
DOVE
Sy = Sx = ∑ w/ v (xi - x)2
∑w v (xi - x)(yi - y)
∑ w v (xi - x)2
Yi = B0 + B1Xi + εi
- ALTEZZA FIGLIE
- COMPONENTE SISTEMATICA LINEARE
- ERRORE: PUNTI NON SONO PERFETTAMENTE ALLINEATI
COEFFICIENTI DI REGRESSIONE
B0 = ∑viwi = z
B1 = ∑wiyi
2viwi = z
ASSUNZIONI SULLA DISTRIBUZIONE εi
- A) E(εi) = 0 ∀ i = 1,...,n
- IMPLICA E(Yi|Y1) = Yi = B0 + B1Xi "INERZIA DELLA MEDIA"
- VAR(εi) = σ2 ≥ 0 ∀ i = 1,...,n
- IMPLICA VAR(yi) = VAR(εi) = σ2 "OMOSCHEDASTICITÀ RISPOSTE"
- COV(εi, εj) = 0 SE i ≠ j "INCOR
-
Appunti completi di Modelli statistici per la genetica
-
Appunti Modelli statistici
-
Appunti Modelli statistici
-
Appunti Modelli matematici e statistici per l'intelligenza artificiale