Analisi bivariata: regressione e correlazione
Le tecniche di analisi bivariata
Paola Bordandini
Le tecniche di analisi bivariata coinvolgono una variabile X (variabile indipendente) che può essere cardinale o quasi categoriale, e una variabile Y (variabile dipendente). È possibile utilizzare diverse tecniche come le tavole di contingenza (ANOVA) e la regressione, nonché la correlazione.
Tavole di contingenza e regressione
Le tavole di contingenza sono applicabili quando la variabile è categoriale, mentre la regressione e l'analisi della correlazione sono usate con variabili cardinali o quasi cardinali. Un importante strumento di analisi bivariata è il diagramma a dispersione (scattergram), che illustra la relazione tra due variabili, come ad esempio il reddito e l'età.
Retta di regressione, residui e outliers
Nel contesto della regressione, si identifica una retta di regressione, e si considerano i residui e gli outliers per valutare la bontà dell'adattamento. Gli outliers possono influenzare negativamente l'analisi e devono essere considerati attentamente.
Alcune formule
La retta di regressione lineare è definita dall'equazione: Y = a + bX. Dove:
- Coefficiente di regressione (b): la pendenza della retta che si calcola come il rapporto tra la codevianza di X ed Y e la devianza di X.
- Intercetta (a): il valore di Y quando X è zero, calcolato come a = Ȳ - bX̄.
Altri concetti importanti includono i prodotti incrociati, i quadrati sugli scarti in ordinata e in ascissa.
Due diagrammi, una stessa retta
La retta Y = 5 + 1,5X rappresenta una situazione dove variazioni in X influenzano linearmente Y. Questo concetto è illustrato in due diversi diagrammi che condividono la stessa equazione di regressione.
Forza della relazione
Il coefficiente di correlazione (r) misura la forza e la direzione della relazione tra due variabili. Si calcola come il rapporto tra la codevianza di X e Y e il prodotto delle radici delle devianze di X e Y.
Il residuo è la differenza tra il valore osservato di Y e il valore previsto dalla retta di regressione.
Confronto tra i coefficienti
Sia il coefficiente di regressione (b) che il coefficiente di correlazione (r) condividono alcune parentele e differenze:
- Parentele:
- Stesso numeratore
- Stesso segno
- Se b=0, r=0
- Differenze:
- Il denominatore
- b è unidirezionale mentre r è bidirezionale
- L'unità di misura
- Il campo di variazione
Coefficiente di determinazione
Il coefficiente di determinazione (r2) esprime la proporzione della varianza di Y che è spiegata dalla variabile X. Viene calcolato come il quadrato del coefficiente di correlazione.
Una panoramica di sintesi
- Diagramma a dispersione
- Retta di regressione
- Calcolo dell'intercetta e del coefficiente di regressione (b)
-
Regressione lineare
-
Regressione logistica
-
Distribuzione doppia e retta di regressione
-
Test a risposta multipla - interpolazione regressione correlazione