INDICI DI TENDENZA CENTRALE
Per quanto da un punto di vista statistico sarebbe più corretto considerare i punteggi su scala ordinale e
calcolare la mediana (Me), la pratica comune è quella di analizzare i punteggi come se fossero su scala a
intervalli e di calcolare quindi la media (M). Alcuni autori suggeriscono che se il numero di alternative
lOMoARcPSD|7210170
ordinabili è per lo meno uguale a 5, gli ancoraggi sono ben bilanciati e la distribuzione di frequenza è
sufficientemente simile alla normale, allora l’uso della media come indice di tendenza centrale è adeguato.
Se la distribuzione deve approssimarsi alla curva
normale, il valore della media dovrebbe corrispondere
a quello medio della scala di risposta. Più è ampia la
distribuzione, maggiore dovrebbe essere il range della
media.
INDICI DI DISPERSIONE
E’ importante che i punteggi siano sufficientemente dispersi attorno ai valori di tendenza centrale. se
consideriamo solo l’informazione a livello ordinale individueremo i valori che corrispondono al primo (Q1)
e al terzo quartile (Q3), calcolando poi anche la differenza interquartile (DI), mentre se consideriamo
l’informazione a livello metrico calcoleremo la deviazione standard (DS).
Sono da considerare con attenzione quegli item in cui la deviazione standard è sensibilmente più bassa
rispetto a tutti gli altri, dato che questa situazione può significare un eccessivo raggruppamento delle
risposte su un solo punto della scala di tipo Likert.
INDICI DI FORMA DELLA DISTRIBUZIONE
SK-skewness= quanto la distribuzione è simmetrica o asimmetrica rispetto al punto mediano
KU-curtosi= quanto la curva è appiattita o appuntita, ossia quanta varianza è dovuta ai valori meno
frequenti, rispetto a quelli che invece sono più vicini alla media
Una distribuzione perfettamente normale possiede SK e CU esattamente uguali a zero, che quindi è il valore
ottimale per questi indici
Per stabilire se lo scostamento da questi valori è trascurabili ci sono 3 possibilità:
a) Esame visivo: a livello grafico la SK mostra un mancanza di simmetria, per cui i punteggi sono più
frequenti a un estremo della scala di risposta; mentre problemi di curtosi si hanno quando la
distribuzione ha forma a campana ma rovesciata, ossia con valori più estremi più frequenti e quelli
centrali meno frequenti (curtosi negativa), o a campana ma troppo appuntita con uno dei valori
centrali estremamente frequente e tutti gli altri con frequenze molto basse (curtosi positiva)
b) Verificare l’ipotesi nulla che i valori siano statisticamente uguali a zero nella popolazione con un test
statistico lOMoARcPSD|7210170
c) Alcuni studi suggeriscono che quando un item di tipo Likert i due indici che hanno un valore
compreso fra -1 e +1, lo scostamento da una perfetta normalità non è fonte di distorsioni rilevanti
nelle successive analisi dei dati, per cui i due indici possono essere ritenuti adeguati
DISCRIMINATIVITÀ
Confrontiamo i punteggi di gruppi di persone che abbiano livelli alti e bassi della caratteristica misurata dal
test: quindi ci aspettiamo che le persone con diagnosi di disturbo paranoide di personalità riportino una
maggiore proporzione di risposte “Vero” o punteggi più alti su una scala di tipo Likert rispetto a persone che
non hanno ricevuto questa diagnosi quando rispondono all’item “Dubito costantemente della lealtà dei miei
amici”.
Da un punto di vista statistico, si può procedere come nel caso dei test di prestazione massima se la scala di
risposta è dicotomica, mentre nel caso di item di tipo Likert si può calcolare la dimensione dell’effetto del
test t per campioni indipendenti (d di Cohen) se consideriamo il punteggio dell’item su scala metrica, oppure
la dimensione dell’effetto del test di Mann-Whitney se consideriamo l’item come ordinale
La formula generale per calcolare il d di Cohen è: il valore di d suggerisce una dimensione
dell’effetto (e quindi, in questo caso, una
discriminatività) trascurabile quando è inferiore
a 0,20, piccola quando 0,20 <= d < 0,50,
moderata quando 0,50 <= d < 0,80 e grande
quando d >= 0,80.
Sempre seguendo le linee guida di h, si può decidere di considerare sufficiente una discriminatività che
assicuri una dimensione dell’effetto almeno piccola o moderata.
RIDONDANZA
Eccessiva correlazione fra i punteggi di due item è un aspetto centrale da considerare perché può avere
ripercussioni sullo studio della dimensionalità del test.
Abbiamo bisogno di ottenere item sufficientemente simili perché possano essere considerati indicatori dello
stesso costrutto, ma anche non troppo simili perché non rappresentino lo stesso item ripetuto
Correlazione >.70= apportano la stessa informazione, dobbiamo sceglierne solamente uno (tramite la
strategia basata sul contenuto).
Se gli item sono dicotomici si può utilizzare il coefficiente di correlazione tetracorica. Nel caso di item di
tipo likert i coefficienti di correlazione che possono essere calcolati sono il coefficiente di Pearson (punteggi
su scala metrica) o il coefficiente di correlazione policorico (punteggi su scala ordinale), che è una
generalizzazione del coefficiente tetracorico al caso di item con risposte su più di due categorie ordinate.
lOMoARcPSD|7210170
CAPITOLO 5
Come possiamo utilizzare i punteggi negli item per ottenere un punteggio che rappresenti la quantità di
caratteristica psicologica che il test si propone di misurare e che è posseduta dalle persone che hanno
risposto?
Il processo che ci permette di ottenere la misura quantitativa di una variabile psicologica prende il nome di
scaling. Tuttavia, la correttezza di questa operazione è basata su una precisa assunzione circa il processo
che genera le risposte agli item di un test, dal punto di vista teorico, e sul fatto che gli item i cui punteggi
vengono sommati siano davvero indicatori di un singolo costrutto.
Attraverso lo scaling (decodifica risposte dei partecipanti) assegniamo alle persone un numero che indica il
grado in cui possiedono la caratteristica misurata dal test.
Possiamo calcolare i punteggi al test come:
• Numero di risposte corrette
• Numero di risposte vero o si
• Somma di punteggi parziali ottenuti rispetto a un massimo punteggio possibile
• Somma dei ratings forniti agli item su una scala Likert a più punti
Generalmente, il punteggio ad un test è ottenuto mediante il numero di risposte corrette (prestazione
massima), oppure somma o media aritmetica dei punteggi ottenuti agli item su una scala di risposta di tipo
Likert (prestazione tipica).
L’assunzione alla base del procedimento è che ogni item, al di là della natura discreta del punteggio che
produce, misura qualcosa di sottostante che in realtà è continuo. Quindi, ogni item è una misura di una
proprietà che può variare quantitativamente e che è comune a tutti gli item.
Quando due variabili sono correlate tra loro, la cosa che ci viene più naturale supporre è che una sia causa
dell’altra: per esempio, se osserviamo che i bambini che si esercitano di più sono anche quelli che ottengono
i punteggi più alti in un test di abilità di lettura ci viene naturale pensare che sia l’esercizio che causa le
prestazioni migliori al test, coerentemente col detto practice makes perfect. Tuttavia, il processo causale che
porta al dato osservato della relazione fra due variabili non è necessariamente sempre questo.
Ha senso pensare che ci sia una terza variabile, non considerata, che causa entrambe le variabili in esame, e
che quindi spiega perché queste risultano correlate. In questo esempio la variabile che non stiamo
considerando è l’età dei bambini: all’aumentare dell’età aumenta il numero di scarpe perché i bambini
crescono e contemporaneamente aumenta anche l’abilità di lettura perché i bambini progrediscono nel loro
percorso scolastico.
A livello empirico, quindi, siamo in grado di ipotizzare la presenza di un costrutto o variabile latente quando
le variabili osservate sono sufficientemente correlate tra loro e le loro relazioni sono teoricamente in termini
causali. (gli item devono correlare tra loro). Ma in casi di terza variabile si parla di RELAZIONE SPURIA,
ossia di una relazione di covariazione senza causazione fra due variabili: la covariazione non è dovuta al
fatto che una è causa e l’altra è effetto, ma al fato che sono entrambe effetti di una stessa causa, detta
variabile di controllo. Una volta che la relazione fra più variabili viene spiegata in termini di variabile di
controllo, la correlazione residua fra le variabili iniziali, ossia quella porzione della loro relazione non
lOMoARcPSD|7210170
spiegabile in base all’effetto della variabile di controllo e dovuta effettivamente alla loro relazione diretta,
diviene prossima a zero.
A volte le relazioni spurie sono dovute al caso, altre volte sono causate da una terza variabile.
Esempio:
Numero di piede e abilità verbali
Numero di gelati venduti e numero di morti per annegamento (più gelati in estate= si va + al mare)
Numero di omicidi e numero di chiese in una città
La terza variabile in questione potrebbe anche essere un altro costrutto latente. Nel caso del modello di
Spearman la variabile di controllo che è causa della relazione rilevata fra le variabili osservate non è una
variabile a sua volta osservabile, ma un costrutto (variabile latente), che l’autore chiamò intelligenza. In altri
termini, le persone particolarmente abili nel calcolo mentale tendevano a esserlo anche in prove di
ragionamento logico e di fluenza verbale (da cui la loro correlazione) non perché queste abilità in qualche
modo si influenzassero fra loro, ma perché erano tutte effetti dell’intelligenza posseduta dalle persone.
Perché il costrutto non è in grado di spiegare completamente la covariazione fra le variabili osservate, per
cui la correlazione residua non è esattamente uguale a zero? La risposta è che potrebbero esservi anche altre
cause (costrutti) responsabili della covariazione osservata fra le variabili.
Anche una volta individuate queste cause, comunque, non necessariamente la predizione in base ai punteggi
nei costrutti del punteggio nella variabile osservata sarà perfetta. Per risolvere la questione, Spearman
introdusse, oltre al concetto di fattore generale (comune), anche quello di fattore specifico, che
rappresenta il contributo di cause specifiche e uniche per quella determinata prova o item alla
determinazione del punteggio osservato (ma non alla sua covariazione con le altre prove o item
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
-
Riassunto esame Tecniche di raccolta dati, Prof. Rizzo Marco, libro consigliato Teoria e tecnica psicometrica. Cost…
-
Riassunto degli approfondimenti di psicometria, Prof. Chiorri, libro consigliato Teoria e tecnica psicometrica
-
Riassunto esame Tecniche di Raccolta Dati, prof Loera, libro consigliato Teorie e tecnica psicometrica, Chiorri
-
Riassunto esame Psicometria, prof. Costa, libro consigliato Fondamenti di Psicometria, Chiorri