Regressione lineare semplice e anova
Nella regressione lineare semplice può essere utile scomporre la devianza:
Si cerca la regga retta che meglio interpola i punti attraverso il metodo dei quadrati minimi, in altri termini si sceglie la retta che riduce al minimo la devianza residua in questo modo:
b1 indica che quando la statura del padre aumenta di un centimetro, la statura del figlio cresce in media 7mm (H(figlio)=54,6cm+0,697cm/cm h(padre)cm.
Assunzioni per la regressione lineare semplice:
ε=0;
omoschedasticità;
indipendenza degli errori;
distribuzione normale degli errori.
Correlazione: il coefficiente di correlazione r è un numero adimensionale che varia tra -1 e +1.
r=-1, i punti si allineano lungo una retta discendente;
r=0, i punti si dispongono a casa, senza mostrare un andamento crescente o decrescente;
r=+1, i punti si allineano lungo una retta ascendente.
r e r2 si calcolano nella seguente maniera:
r2 indica quanto bene la X spiega la Y, ad esempio se r2=15.5% si può affermare che il 15.5% del punteggio del test può essere spiegato con il voto di maturità.
Analisi della varianza (anova) a 1 criterio
L’analisi della varianza si utilizza quando vi sono k gruppi con un numero variabile di unità statistiche. Ogni unità statistica viene individuata da due numeri in posizione pedice: il primo indica il gruppo di appartenenza e il secondo indica la posizione del soggetto all’interno del gruppo.