Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
X Q
Infine, se si volesse :
TROVARE IL VALORE DI CHE CORRISPONDE AL 1
a) Si cerca sulle tavole la proporzione che più si avvicina a 0.2500 (il primo quartile delimita
un’area nella prima metà della curva, con 0.2500 al di sotto e 0.7500 al di sopra)
b) Trovato il valore z corrispondente (0.2486 → z = 0.67), si cambia di segno perché siamo nella
metà inferiore della curva, e si applica la formula inversa per trovare X:
= + ⋅ = + − ⋅ =
X X z s 52 ( 0 .
67 ) 12 43 .
96
3. RELAZIONI TRA VARIABILI
C
La è la tendenza che due variabili X e Y, misurate sugli stessi soggetti, hanno a
OVARIANZA
“variare insieme”. Si possono studiare sia:
• Tipo di relazione : la forma della relazione (lineare, curvilinea)
12
• Intensità della relazione : la forza del legame tra X e Y (nulla, concordanza, discordanza)
• Direzione della relazione : se la relazione è positiva, i valori di X e Y crescono
concordemente, se è negativa, al crescere di una variabile corrisponde il diminuire dell’altra
3.1 - TIPO DI RELAZIONE (FORMA)
Per avere un’idea della tra X e Y, si rappresenta la posizione degli N
FORMA DELLA RELAZIONE
soggetti nel diagramma di dispersione. Sulle ascisse si riportano i valori di X, sulle ordinate i valori
di Y, segnando un punto per ogni soggetto all’incrocio tra il suo punteggio X e il suo punteggio
Y.
Come detto, le relazioni possono avere direzione positiva o negativa:
Oppure, le due variabili possono essere indipendenti l’una dall’altra:
3.2 - INTENSITÀ E DIREZIONE DELLA RELAZIONE
Per misurare l' lineare tra X e Y, quando le due variabili sono misurate su
INTENSITÀ DEL LEGAME
scale a intervalli o rapporti equivalenti, si utilizza un indice che esprime sia l'intensità che la
P
direzione della relazione, detto coefficiente di correlazione lineare o :
COEFFICIENTE R DI EARSON
n
∑ ⋅
Z Z
x y
=
r 1 n
Z e Z sono i punteggi standardizzati delle variabili X e Y:
x y − −
X X Y Y
= =
Z Z
x Y
S S
x Y
Il coefficiente r di Pearson varia tra -1.00 e +1.00, ed ha i seguenti significati:
a) r = +1.00 → massima concordanza positiva (all’aumentare di X, Y aumenta in modo costante)
b) r positivo → le variazioni di X e Y covariano nella stessa direzione (concordanza)
c) r = 0.00 → assenza di relazione (le variabili sono indipendenti)
d) r negativo → le variazioni di X e Y covariano nella direzione inversa (discordanza)
e) r = -1.00 → massima correlazione negativa (all’aumentare di X, Y diminuisce in modo costante)
Per “semplicità”, la stesa formula può essere trasformata in: 2
Tale coefficiente elevato al quadrato, il (r ), esprime la
COEFFICIENTE DI DETERMINAZIONE
proporzione di varianza comune alle due variabili , è sempre positivo e compreso tra 0.00 e
+1.00.
3.3 - COEFFICIENTE DI CORRELAZIONE TRA RANGHI
C
Se le due variabili sono su scala ordinale, si calcola il (rho) di Spearman:
OEFFICIENTE R
S
13 n
∑
6 d 2
i
= −
r 1 1
s ⋅ −
2
n ( n 1
)
Dove d è uguale alla differenza tra ciascuna coppia di ranghi (X - Y ).
i i i
r varia tra -1.00 e +1.00 ed ha lo stesso significato del coefficiente r di Pearson.
s
Soggett X Y d 2
d
i
A 1 2 -1 1
B 3 4 -1 1
C 4 5 -1 1
D 2 3 -1 1
E 5 1 +4 16 2
20 (Σd )
6 x 20 120
= − = − =
r 1 1 0 .
00
s ⋅ −
5 ( 25 1
) 120
Non c’è relazione tra le graduatorie
Tuttavia, se una delle due variabili è misurata su scala ordinale (X) e l’altra su scala a rapporti o
intervalli equivalenti (Y), per poter calcolare il coefficiente r di Spearman bisogna trasformare i
s
punteggi Y in ranghi. Ad esempio, se la variabile Y è il voto in un test, si ordinano i punteggi Y in
ordine crescente e si trasforma così la misura in una scala ordinale.
3.4 - COEFFICIENTE PUNTO-BISERIALE
Per calcolare la relazione tra una variabile X su scala a intervalli o rapporti equivalenti e una
C -
variabile dicotomica Y (a soli due livelli), si usa il OEFFICIENTE DI CORRELAZIONE PUNTO
:
BISERIALE −
X X n n
a b a b
= ⋅ ⋅
r pb s N N
x
- n è il numero di soggetti con valore Y = “a” (giusto, 1)
a
- n è il numero di soggetti con valore Y = “b” (errato, 0)
b
- s è la deviazione standard di X
x
- è la media degli n soggetti con Y = “a”
X a
a
- è la media degli n soggetti con Y = “b”
X b
b
Come il coefficiente r di Pearson, il coefficiente r assume valori da -1.00 a +1.00.
pb
È un indice molto utilizzato per valutare la coerenza interna dei test, confrontando la correlazione
di ciascun item dicotomico con il punteggio totale del test.
Ponendo che N = 11 soggetti rispondano a delle domande di un test (risposta SI/NO), si può stimare
la correlazione tra le risposte a 2 domande (D1, D2) con il punteggio totale ottenuto nel test (X):
Soggetti D1 (Y) D2 (Y) TOT (X)
A 1 1 6
B 1 1 7
C 0 1 5
D 0 0 2
E 1 1 5
F 0 0 2
G 1 0 4
H 1 1 6
14
I 1 1 7
L 1 0 3
M 1 0 4
Per trovare la correlazione tra la D1 e il TOT: + + + + + + +
6 7 5 4 6 7 3 4
= =
Per gli 8 valori di D1 = 1, la media su n = 8 soggetti sarà X 5 .
25
a) 1
1 8
+ +
5 2 2
= =
Per i 3 valori di D1 = 0, la media su n = 3 soggetti sarà X 3
. 00
b) 0
2 3
=
La deviazione standard degli 11 valori di X è s 1
.
80
c) x
−
5 . 25 3 . 00 8 3
d) = ⋅ ⋅ =
r 0 .
55
pb 1 . 80 11 11
Per trovare la correlazione tra la D2 e il TOT: + + + + +
6 7 5 5 6 7
= =
Per i 6 valori di D2 = 1, la media su n = 6 soggetti sarà X 6 .
00
a) 1
1 6
+ + + +
2 2 4 3 4
= =
Per i 5 valori di D2 = 0, la media su n = 5 soggetti sarà X 3 . 00
b) 0
2 5
−
6
.
00 3
.
00 6 5
c) = ⋅ ⋅ =
r 0
.
83
pb 1
.
80 11 11
3.5 - RELAZIONE TRA DUE VARIABILI DICOTOMICHE
Per la correlazione tra variabili dicotomiche, si costruisce una tabella con le risposte di X e Y:
Giusto (Y) Sbagliato (Y) Totale
Giusto (X) F F P = F +F
a b a b
Sbagliato (X) F F Q = F +F
c d c d
Totale P’ = F +F Q’ = F +F N
a c b d
- F , F , F e F sono le frequenze nelle celle
a b c d
- P e Q sono i totali marginali per riga
- P’ e Q’ sono i totali marginali per colonna
C
Si applica poi il , il cui valore varia tra -1.00 e +1.00:
OEFFICIENTE R
PHI ⋅ − ⋅
F F F F
a d b c
=
r phi ⋅ ⋅ ⋅
( P P ' ) (
Q Q ' )
3.6 - REGRESSIONE
R
La è la previsione di un valore sconosciuto di una variabile dal valore conosciuto
EGRESSIONE 2
di un’altra variabile. Il coefficiente di determinazione (r ) esprime la proporzione di varianza della
variabile dipendente che viene “spiegata” dalla variabile indipendente. Pertanto, la varianza
residua, ossia la proporzione di varianza della variabile dipendente “non spiegata” dalla
variabile indipendente, corrisponde a . Nel caso di correlazione perfetta, negativa o positiva,
− 2
1 r
la varianza spiegata è pari al totale ( ) e la varianza residua è zero ( ).
= − =
2
2 1 r 0
r 1
Tramite l’equazione di regressione si può predire il valore di una variabile da quello di un’altra.
Nel diagramma di dispersione si deve trovare una retta che esprima Y in funzione di X, scegliendo
tra infinite rette quella che minimizza la somma delle differenze al quadrato tra le Y effettive e
∑ − =
quelle Y’ calcolate con l’equazione (condizione dei minimi quadrati): 2
( y y ' ) min
= + ⋅
Data l’equazione generica di una retta, , a rappresenta l’intercetta e b il coefficiente
Y ' a b x
y y
angolare, e si calcolano in questo modo:
∑ ∑ ∑
−
N XY X Y
=
b = − ⋅
a Y b X
y ∑ ∑ y y
−
2 2
N X ( X )
Per il si procede:
CALCOLO E LA RAPPRESENTAZIONE GRAFICA DELLA RETTA DI REGRESSIONE
15
2 2
X Y XY X Y
1 10 10 1 100
2 12 24 4 144
6 50 300 36 2500
3 30 90 9 900
6 62 372 36 3844
7 60 420 49 3600
4 45 180 16 2025
29 269 1396 151 13113
=
X 4 .
1
=
Y 38
. 4
⋅ − ⋅
7 1396 29 269
= =
1) b 9
. 125
y ⋅ − 2
7 151 29
= − ⋅ =
2) a 38
.
4 (
9 .
125
) 4
.
1 0 .
99
y = + ⋅ ≈ + ⋅
È così possibile trovare l’equazione della retta di regressione: y 0
.
99 9
.
125 x 1 9 x
3)
4) Basta calcolare due soli punti Y, corrispondenti a due valori di X (presenti o no nella distribuzione
effettiva) e tracciare la retta che unisce i due punti. Scegliendo, ad esempio, X = 0 e X = 6:
1 2
= = + ⋅ =
X 0 Y 1 9 0 1
1 1
= = + ⋅ =
X 6 Y 1 9 6 55
2 2
I punti trovati corrispondono quindi a (0, 1) e (6,55).
E S
L’ misura la variabilità dei punti osservati
RRORE TANDARD DALLA RETTA DI REGRESSIONE
attorno alla retta. Più l’indice s è piccolo, più la retta predice bene i valori Y’ da quelli di X:
y/x ∑ − 2
(
Y Y ' )
= = − −
s s 1 r 2
y / x y xy
−
N 2
Inoltre, è possibile trovare anche la retta di regressione che esprime X in funzione di Y:
= + ⋅
X ' a b y
x x
∑ ∑ ∑
−
N XY X Y
=
b = − ⋅
a X b Y
x ∑ ∑ x x
−
2 2
N Y ( Y )
In generale, meno forte è la relazione, più le rette si distanziano:
- Se r = 0 le rette sono perpendicolari (mancanza totale di relazione)
- Se r = ± 1.00 le due rette coincidono (relazione perfetta)
3.7 - STIMA DI ATTENDIBILITÀ E VALIDITÀ DEI TEST
Tra le procedure che richiedono 2 somministrazioni vi sono:
• T - : somministrare lo stesso test agli stessi soggetti per due volte e calcolare il
EST RETEST
coefficiente di correlazione r, o coefficiente di stabilità (si ritiene elevato se superiore a 0.75)
• F : somministrare d