vuoi
o PayPal
tutte le volte che vuoi

Il coefficiente di correlazione è un importante strumento statistico che consente di stabilire il grado di relazione lineare tra due serie di dati. Fu lo scienziato Francis Galton cugino di Charles Darwin, ad utilizzare per la prima volta il coefficiente di correlazione, proposto dal collega Karl Pearson, per quantificare il “grado di associazione” tra due variabili. Tale coefficiente, noto come coefficiente di Pearson, viene definito come ...
Un metodo di rappresentazione geometrica dei coefficienti di
correlazione e di determinazione
Marco Piumetti
Il coefficiente di correlazione è un importante strumento statistico che
consente di stabilire il grado di relazione lineare tra due serie di dati. Fu lo
scienziato Francis Galton cugino di Charles Darwin, ad utilizzare per la
prima volta il coefficiente di correlazione, proposto dal collega Karl
Pearson, per quantificare il “grado di associazione” tra due variabili. Tale
coefficiente, noto come coefficiente di Pearson, viene definito come il
rapporto tra la sommatoria dei prodotti dei vari punteggi standard delle due
variabili ed i gradi di libertà; esso può variare da un massimo di +1,00
(perfetta correlazione positiva) ad un minimo di -1,00 (perfetta correlazione
negativa). Francis Galton 1822-1911
⎛ ⎞ ⎛ ⎞
− −
X X Y Y
1 ∑ ⎜ ⎟ ⎜ ⎟
= i i
r ⎜ ⎟ ⎜ ⎟
−
n 1 s s
⎝ ⎠ ⎝ ⎠
x Y
−
X X
i X s
In cui: , , x
s x
rappresentano rispettivamente i punteggi standard, la media e la deviazione standard (calcolata
usando n-1 al denominatore). coefficiente di determinazione
Il quadrato del coefficiente di correlazione, meglio noto come ,
misura la “varianza spiegata”, ossia la percentuale della variabilità di Y spiegata dalla variabilità di
X. Pertanto, tale coefficiente può essere molto utile per valutare l’influenza di una variabile su di
un’altra. Se, per esempio, si considera il fatto che esiste una significativa correlazione tra la
presenza di persone senza lavoro e la percentuale di disoccupati con un’educazione inferiore alla
scuola secondaria (r = 0,70) ciò significa che circa il 50 % della varianza della disoccupazione
potrebbe essere spiegato in termini di scolarità.
Il coefficiente di correlazione può essere rappresentato graficamente come il coseno dell’angolo
formato tra due vettori associati alle variabili X ed Y. Calcolando, infatti, il prodotto scalare tra due
vettori (X, Y) si può risalire all’angolo θ ed è pertanto possibile rappresentare nel piano due serie di
dati. θ
⋅ =
X Y Y X cos *
Tuttavia, il coefficiente di correlazione che si ricava è generalmente non centrato (r ), poiché la
media delle due variabili può essere diversa da zero (condizione necessaria per ottenere r centrato).
⋅
X Y
θ = = *
cos r
X Y
⎛ ⎞
⋅
X Y
⎜ ⎟
θ = = *
arccos arccos r
⎜ ⎟
X Y
⎝ ⎠