Anteprima
Vedrai una selezione di 1 pagina su 3
Un metodo di rappresentazione geometrica dei coefficienti di correlazione e di determinazione Pag. 1
1 su 3
Disdici quando vuoi 162x117
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Sintesi
galton.jpg
Il coefficiente di correlazione è un importante strumento statistico che consente di stabilire il grado di relazione lineare tra due serie di dati. Fu lo scienziato Francis Galton cugino di Charles Darwin, ad utilizzare per la prima volta il coefficiente di correlazione, proposto dal collega Karl Pearson, per quantificare il “grado di associazione” tra due variabili. Tale coefficiente, noto come coefficiente di Pearson, viene definito come ...
Estratto del documento

Un metodo di rappresentazione geometrica dei coefficienti di

correlazione e di determinazione

Marco Piumetti

Il coefficiente di correlazione è un importante strumento statistico che

consente di stabilire il grado di relazione lineare tra due serie di dati. Fu lo

scienziato Francis Galton cugino di Charles Darwin, ad utilizzare per la

prima volta il coefficiente di correlazione, proposto dal collega Karl

Pearson, per quantificare il “grado di associazione” tra due variabili. Tale

coefficiente, noto come coefficiente di Pearson, viene definito come il

rapporto tra la sommatoria dei prodotti dei vari punteggi standard delle due

variabili ed i gradi di libertà; esso può variare da un massimo di +1,00

(perfetta correlazione positiva) ad un minimo di -1,00 (perfetta correlazione

negativa). Francis Galton 1822-1911

⎛ ⎞ ⎛ ⎞

− −

X X Y Y

1 ∑ ⎜ ⎟ ⎜ ⎟

= i i

r ⎜ ⎟ ⎜ ⎟

n 1 s s

⎝ ⎠ ⎝ ⎠

x Y

X X

i X s

In cui: , , x

s x

rappresentano rispettivamente i punteggi standard, la media e la deviazione standard (calcolata

usando n-1 al denominatore). coefficiente di determinazione

Il quadrato del coefficiente di correlazione, meglio noto come ,

misura la “varianza spiegata”, ossia la percentuale della variabilità di Y spiegata dalla variabilità di

X. Pertanto, tale coefficiente può essere molto utile per valutare l’influenza di una variabile su di

un’altra. Se, per esempio, si considera il fatto che esiste una significativa correlazione tra la

presenza di persone senza lavoro e la percentuale di disoccupati con un’educazione inferiore alla

scuola secondaria (r = 0,70) ciò significa che circa il 50 % della varianza della disoccupazione

potrebbe essere spiegato in termini di scolarità.

Il coefficiente di correlazione può essere rappresentato graficamente come il coseno dell’angolo

formato tra due vettori associati alle variabili X ed Y. Calcolando, infatti, il prodotto scalare tra due

vettori (X, Y) si può risalire all’angolo θ ed è pertanto possibile rappresentare nel piano due serie di

dati. θ

⋅ =

X Y Y X cos *

Tuttavia, il coefficiente di correlazione che si ricava è generalmente non centrato (r ), poiché la

media delle due variabili può essere diversa da zero (condizione necessaria per ottenere r centrato).

X Y

θ = = *

cos r

X Y

⎛ ⎞

X Y

⎜ ⎟

θ = = *

arccos arccos r

⎜ ⎟

X Y

⎝ ⎠

Dettagli
3 pagine