Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
VERIFICA DELLE IPOTESI SULLE RELAZIONI TRA VARIABILI
Coefficiente di correlazione lineare r di Pearson
La serve a mettere in evidenza la relazione esistente tra due variabili: stabilire il tipo di relazione,
correlazione
stabilire il grado (forza o intensità) di tale relazione e stabilire la direzione di tale relazione. Ad esempio età e
peso, tempo di esecuzione di un compito e numero di errori, stress e sintomi psicosomatici.
Es. 6 soggetti cui chiediamo la loro intenzione di esercitarsi all’uso del computer durante la settimana
successiva; inoltre chiediamo loro se pensano sia difficile esercitarsi al computer.
Vogliamo verificare se esiste una relazione fra intenzione e percezioni di controllo e osserviamo una certa
distribuzione di punteggi. 47
Diagramma di dispersione:
Coordinate I=x C=y Punto = coppia di valori
x = intenzione y = controllo y= f(x)
La nube dei punti si sviluppa secondo una retta, la relazione è lineare.
1. Calcolare il punto le cui coordinate sono le medie.
Covarianza: misura del grado di associazione di due variabili.
Covxy = E (x-Mx)(y-My) / n
Può assumere valori positivi e negativi, quando è 0 x e y sono indipendenti, aumenta al crescere del
grado di dipendenza tra x e y.
Limite: misura relativa, dipende dall’unità di misura delle variabili.
2. Misurare dispersione della nube di punti, ossia la deviazione standard di x e y. Il coefficiente r è una
sorta di covarianza standardizzata: r = Ezxizyi / n, media dei prodotti dei punteggi xi e yi standardizzati.
Il costituisce un indice della bontà di adattamento della retta, ottenuta con il metodo
coefficiente r di Pearson
dei minimi quadrati (minimizza la somma delle distanze tra i punti e la retta), ai dati campionari. Misura la
forza della relazione (valore), la direzione della relazione (segno), è sempre compreso tra -1 e 1 inclusi, può
essere usato solo con variabili misurate almeno su scala a intervalli.
Può essere calcolato anche attraverso queste 3 formule, equivalenti alla precedente: vedere 6 schemi.
r = covarianza standardizzata, rapporto tra la covarianza (Sxy oppure Covxy) e le deviazioni standard (Sx e Sy)
di x e y, quindi è indipendente dall’unità di misura di x e y.
Interpretazione di r:
se r = +-1 relazione lineare perfetta
se r = 0 assenza di relazione lineare
se r < |.20| relazione molto debole
se |.20| < r < |.40| relazione moderata
se |.40| < r < |.60 relazione abbastanza forte
se r > |.60| relazione forte (+ esempi)
Es. calcolo: abbiamo 6 soggetti cui chiediamo la loro intenzione di esercitarsi all’uso del computer durante la
settimana successiva; inoltre chiediamo loro se pensano sia difficile esercitarsi al computer. Vogliamo
verificare se esiste una relazione fra intenzione e percezioni di controllo. Per usare la formula bisogna
moltiplicare x per y ed elevare x e y al quadrato, poi facciamo una somma.
Trasformazione in unità standard: si perdono le unità di misura originali di ogni variabile. r: numero
indipendente dall’unità di misura. Cambiamento ordine delle variabili non determina cambiamento del
coefficiente di correlazione (r: media dei prodotti delle variabili standardizzate): la correlazione non ci dice
nulla sulla direzione dell’effetto (quale variabile influenza l’altra). Influenza reciproca: al variare di una varia
anche l’altra.
Verifica delle ipotesi su r di Pearson: come posso valutare se la relazione sintetizzata tramite il coefficiente di
correlazione è significativa, cioè probabilisticamente diversa da zero?
Verifica dell’ipotesi su P (rho), parametro nella popolazione corrispondente alla statistica r.
L’ipotesi viene verificata trasformando la r in una t. Sono anche disponibili dei valori critici del coefficiente r
(per piccoli campioni), ma solo per ipotesi monodirezionali. Quindi usare t è una scelta spesso più comoda e
generale.
Una popolazione da cui estraiamo un campione e vi misuriamo due variabili metriche (covarianza): uso la
normale bivariata (spazio cartesiano a tre assi, tridimensionale) e quindi la distribuzione t. 48
1. Scelta del test statistico: si calcola r e si trasforma in t
2. Definizione dell’ipotesi
3. Fissare il livello di significatività alfa e calcolare i gradi di libertà: si delinea la regione di rifiuto in base
a alfa (= .05; .01; .001; ecc.), gdl=n- 2, H1 (mono/bi-direzionale) trovando un tcritico sulla tavola
4. Associare una probabilità ad H0 calcolando e trasformando r in t
t = r x radice n-2 / 1-r^2
5. Decisione: il confronto avviene tra t e tcritico, |t| < |tcritico| = p > alfa, si accetta H0, al contrario si
accetta H1 (+ esempio).
Indagare la relazione esistente tra due variabili significa:
- stabilire l’esistenza di una relazione:la verifica dell’ipotesi sul valore del coefficiente di correlazione
ottenuto attesta la presenza o meno di una relazione lineare significativa;
- stabilire il grado (intensità o strettezza) di tale relazione: il valore del coefficiente di correlazione indica
la forza della relazione lineare (ad esempio: valori di r attorno a .70 indicano una relazione molto forte,
attorno a .20 debole);
- stabilire la direzione della relazione: il segno del coefficiente di correlazione indica la direzione della
relazione lineare (ad esempio, se r è positivo indica che al crescere di x cresce y)
Per interpretare la correlazione dobbiamo chiederci: la relazione è (significativamente) diversa da zero? Qual
è il verso della relazione? Quanto è forte la relazione? In base alle risposte a queste domande interpretiamo il
risultato.
Coefficienti di correlazione non parametrici
Spesso capita di non avere a disposizione delle misure di tipo metrico per le due variabili, x e y, che si pensa
possano essere associate. Se si hanno scale dicotomiche o ordinali, vi sono una varietà di coefficienti
concettualmente simili alla r di Pearson.
Se si dispone di frequenze, un coefficiente calcolato su una tabella di contingenza consente di indagare ipotesi
di associazione. Immaginiamo di aver osservato i comportamenti aggressivi e quelli oppositivi di 14 adolescenti
durante le loro interazioni con i genitori. Preferiamo misurare le due variabili come due graduatorie (dal meno
aggressivo al più aggressivo; dal meno oppositivo al più oppositivo). Non possiamo utilizzare r di Pearson (la
graduatoria indica il livello di misura ordinale; non abbiamo misure metriche).
I coefficienti non parametrici devono essere utilizzati anche quando una sola delle due variabili in relazione
non raggiunge il livello metrico di misurazione.
ranghi: rs di Spearman
Coefficiente di correlazione tra
Va calcolato quando i dati sono costituiti da ranghi (graduatorie) oppure quando una delle variabili è ordinale,
e l’altra metrica (previa trasformazione in rango).
Si basa sulle differenze d tra i ranghi attribuiti a ciascuna coppia di valori e può essere calcolato tramite la
formula:
rs = 1 - 6Ed2i / N(N^2 - 1)
di = differenza tra i ranghi di ciascuna coppia di punteggi
n = numero dei soggetti (o coppie di punteggi)
Quando i ranghi delle due graduatorie coincidono tutte le d = 0 quindi: 6Ed2 = 0, rs = 1-0 = 1 (correlazione
positiva perfetta), oppure quando le posizioni in graduatoria sono esattamente opposte il coefficiente sarà rs
= -1 (correlazione negativa perfetta). 49
Es. comportamenti aggressivi (x) e oppositivi (y) di 14 adolescenti.
Ciascun soggetto è stato classificato sulla base di due variabili ordinali (graduatorie). Il coefficiente risulta: 0.29
Verifica delle ipotesi: come posso valutare se la relazione sintetizzata tramite il coefficiente di correlazione rs
è significativa, cioè probabilisticamente diversa da zero?
Con la Verifica dell’ipotesi su Ps (rhos), parametro nella popolazione corrispondente alla statistica rs, dunque
si procede in modo analogo a r di Pearson. Vanno però distinti due casi: se n ≤ 30, i valori rs critici sono tabulati
per due livelli di alfa (.05 e .01) e ipotesi monodirezionale in funzione del numero dei soggetti (non gdl);
se n > 30, così come per il coefficiente r di Pearson, esiste una relazione tra rs e t di Student.
Una popolazione, un campione, due variabili ordinali:
1. Scelta del test statistico: si calcola rs
2. Definizione dell’ipotesi: confronto con la popolazione di riferimento H0: Ps =0 H1: Ps diverso 0
(bidirezionale solo se n > 30)
Ps > o < 0 (monodirezionale se n < 30)
3. Fissare il livello di significatività alfa: si delinea la regione di rifiuto in base a alfa (= .05; .01; .001; ecc.),
n (per n<30) oppure gdl=n-2 (per n>30), H1 (monodirezionale per n < 30), H1 mono-/bi-direzionale
per n > 30), trovando un rs critico (per n < 30) oppure tcritico (per n > 30) sulla tavola.
4. Associare una probabilità ad H0: quando n < 30, si associa una probabilità ad H0 calcolando rs e
confrontandola con rs critico.
Quando n > 30, si associa una probabilità ad H0 calcolando rs , trasformandolo in t e confrontandolo
con tcritico
5. Decisione: il confronto avviene tra rs e rs critico per n < 30 oppure tra t e tcritico per n > 30.
rs < rs critico oppure t<tcritico, = p > alfa
Si accetta H0, l’ipotesi di un’assenza di relazione (Ps =0) è probabilmente vera, la relazione tra le due
variabili non è significativa. Al contrario si rifiuta H0, si accetta H1, l’ipotesi di un’assenza di relazione
(Ps =0) è probabilmente falsa e la relazione tra le due variabili è significativa (+ esempio).
Quando una o entrambe le variabili non costituiscono già una graduatoria, dobbiamo trasformale in ranghi,
es. misuriamo su sei pazienti l’autostima (0 “bassa”; 6 “alta”) e l’insonnia (numero di notti in una settimana in
cui si ha difficoltà ad addormentarsi).
Sono associate? (alfa = .05)
Le due variabili non costituiscono in questa forma delle graduatorie. Se tuttavia consideriamo ordinali le due
misure (o anche almeno una) debbo trasformarle in ranghi prima di calcolare la loro associazione.
- Trasformazione in ranghi: ordino i soggetti in modo crescente e assegno i ranghi; se due punteggi sono
uguali, assegno rango medio. Unisco le due graduatorie in un’unica tabella, stando attento a
mantenere sulla stessa riga i punteggi e i ranghi del medesimo soggetto, e calcolo dunque rs.
Per testare l’ipotesi nulla possiamo:
- usare un’approssimazione alla t (per grandi campioni)
- usare una tavola con valori «esatti» di rs (per piccoli campioni)
La tavola però prevede valori critici solo per ipotesi monodirezionali e dunque è consigliabile usare la
trasformazione in t (gdl = n – 2): confronto t con tcritico e accetto l’ipotesi in questione.
dicotomiche: rphi
Coefficiente di correlazione tra variabili
Va calcolato quando i d