Video appunto: Regressione lineare multipla

Regressione lineare multipla



Regressione lineare multipla:
La regressione lineare multipla permette di contemporaneamente valutare l’influenza su una variabile definita variabile di risposta di molte variabili che sono dette esplicative o indipendenti, e serve poi a valutare l’influenza di una variabile che è detta esplicativa su una variabile di risposta.

Ad esempio Y potrebbe essere il peso, X1 l’età, X2 la statura e X3 l’introito calorico.
Con E(Y) si calcola il valore medio del peso.
Nella regressione lineare multipla la funzione legame è l’= (identità), che unisce la variabile dipendente al predittore lineare; invece nel modello di regressione logistica la funzione legame è log⁡[/(1-)]=.
Le assunzioni della regressione lineare multipla sono:
ε=0;
omoscedasticità;
indipendenza e distribuzione normale degli errori.
In questo caso come metodo di ottimizzazione è opportuno utilizzare il metodo dei minimi quadrati che necessitò dell’omoscedasticità e che viene utilizzato per i modelli lineari in cui la funzione legame è l’identità (regressione lineare semplice e multipla, anova e ancova).
È necessaria anche in questo caso la scomposizione della devianza:
H0: tutte le variabili predittive sono irrilevanti (β1=β2=0).
Il test F permette di calcolare il coefficiente di determinazione R2, che permette ad esempio di affermare che il 61,1% della variabilità nel peso neonatale è spiegata dalla correlazione con l’età gestionale e con la statura.