Estratto del documento

MISURARE LA MENTE

I TEST COGNITIVI E DI PERSONALITÀ

SANTO DI NUOVO

1. L’AMBIZIONE DI MISURARE LA MENTE: COME E PERCHÉ

Il test, considerato da molti lo strumento diagnostico di eccellenza per valutare gli aspetti della psiche,

include un aspetto essenziale che lo distingue da tutti gli altri: la possibilità di “misurare” questi aspetti.

Questa misurazione garantisce la scientificità della valutazione.

Misurare vuol dire attribuire numeri a oggetti ed eventi secondo determinate regole. Alle relazioni tra gli

oggetti devono corrispondere relazioni tra i numeri.

1. LA NASCITA DEI TEST IN PSICOLOGIA

L’idea di test come reattivo diagnostico nasce e si sviluppa con i tentativi di misurare le differenze fra le

persone nella risposta a stimoli uguali.

La prima definizione di test mentale viene formulata nel 1890 da Cattel, che aveva importato negli Stati

Uniti i metodi di Galton, tentando di affermare la scientificità della psicologi: in realtà i primi test mentali

misuravano solo una parte delle abilità psichiche, essendo basati soprattutto sui tempi di reazione.

In Francia Binet e Simon, tra il 1905 e il 1908, mettono a punto un test in grado di discriminare gli allievi

bisognosi di istruzione differenziata. L’obiettivo dichiarato è quello di separare le capacità intellettive

misurate dal grado di istruzione, evitando prove simili a quelle scolastiche.

Mettono a punto il concetto di età mentale, definita come età rilevabile dal test e relativa alle capacità

medie dei bambini di quell’età. Binet e Simon misero subito in guardia sul fatto che i punteggi possono

essere resi poco attendibili da un margine di errore insito nella misurazione e dalla complessità del

concetto di intelligenza.

Nel 1916 Lewis Terman appronta la versione americana del test. Riprendendo una definizione dello

psicologo Wilhelm Stern, introduce come esito della valutazione il quoziente intellettivo, definito come il

rapporto fra età mentale ed età cronologica moltiplicato per 100.

Il contributo anglo-franco-tedesco trova la sua ampia diffusione nella pragmatica società statunitense,

dove il test di Terman viene ripreso da Robert Yerkes, presidente dell’American Psychological Association,

e usato per costruire i due test che servono da valutazione dei soldati da arruolare per la prima guerra

mondiale. Nascono così i test Army Alpha (o Beta nella versione per analfabeti o non esperti di inglese).

Nel primo dopoguerra, sempre negli Stati Uniti, le scuole e le aziende usano strumenti per la misurazione

delle attitudini e delle capacità sia cognitive che di adattamento di bambini e operai. I test di

somministrazione sono lunghi e costringono a un impegno forte e costante, misurando così non solo le

capacità cognitive, ma anche le abilità di resistenza.

Ma non è solo questo aspetto ad essere oggetto di critica: è soprattutto l’uso che si fa di questi strumenti,

per scopi selettivi o di esclusione sociale.

A questo punto l’American Psychological Association sente il dovere di mettere a punto specifiche norme

su come costruire e usare i test. Queste norme sono ancora in vigore e servono a regolamentare l’uso dei

test. 1

2. COS’È UN TEST PSICOMETRICO?

1. Il test è un insieme di stimoli rigorosamente standardizzati:

i singoli stimoli che compongono un test, denominati item, possono consistere in domande, richieste

di prove grafiche o motorie o di prestazioni di vario tipo. Gli item devono essere standardizzati, cioè

sempre uguali ed esenti da possibili variazioni, e graduati per difficoltà, se si tratta di prove di

efficienza.

2. Le modalità di somministrazione sono rigorosamente standardizzate:

• Le condizioni di presentazione delle prove devono essere sempre uguali e analiticamente riportate

nel manuale che accompagna il test;

• Le istruzioni riportate nel manuale non possono essere modificate;

• Il setting in cui il test è applicato deve essere privo di elementi di distrazione o variabilità.

Questa standardizzazione è il fondamento dell’attendibilità del test, cioè della sua ripetibilità alle

stesse condizioni in tempi e luoghi diversi.

3. Gli stimoli sono rappresentativi di una certa funzione cognitiva o area della personalità:

il test è tanto più valido quanto più tale rappresentatività è adeguata, ossia si può essere certi che lo

strumento rileva tutto e solo ciò che con esso si intende rilevare.

4. Le risposte del soggetto vengono codificate in modo obiettivo ricavandone dei punteggi:

per l’assegnazione dei punteggi ci si avvale di griglie o di schemi rigorosamente prefissati. Psicologi

che valutano il test in luoghi e contesti diversi devono poterlo fare in modo omogeneo.

5. I punteggi sono convertibili in valori standard:

in modo da uniformare i criteri di interpretazione. Il manuale deve riportare istruzioni dettagliate per la

conversione dei punteggi grezzi in punteggi ponderati e quindi confrontabili fra diversi test.

6. I punteggi sono riferiti a un campione normativo, rappresentativo della popolazione da cui è tratto

il soggetto sottoposto a esame:

il confronto fra i punteggi ottenuti dal soggetto in esame e quelli medi ottenuti da un ampio campione

tratto dalla popolazione di cui il soggetto fa parte garantiscono che egli sia valutato sul metro più

adeguato per le sue caratteristiche.

7. Il lavoro preliminare compiuto dagli autori per garantire la standardizzazione degli stimoli e dei criteri

di assegnazione dei punteggi è definito taratura. Deve essere riportata in modo chiaro e dettagliato

nel manuale.

8. Sulla base dei punti standard così ottenuti e del confronto con la taratura, è possibile quantificare le

differenze tra soggetti nelle prestazioni al test, o dello stesso soggetto in momenti diversi. La

sensibilità al test consiste nel compiere in modo più accurato questa differenziazione fra i soggetti.

2.1 ASPETTI CRITICI

Ciascun elemento della definizione di test comporta dei punti critici, alcuni dei quali possono essere risolti

con accorgimenti specifici, altri richiedono dei criteri diversi di testing.

1. Comprensione degli stimoli:

gli stimoli presentati devono essere comprensibili dal soggetto, che deve capire ciò che gli viene

chiesto e condividere il significato e la ragione di ciò che sta facendo. Il testing in modalità non verbale

rappresenta con certi soggetti un modo di superare il problema della comprensione linguistica, ma la

comprensibilità è spesso non riconducibile solo ad aspetti linguistici, bensì ad aspetti relazionali e

culturali.

2. Interazione fra somministratore del test e soggetto che lo esegue:

il testing psicologico avviene in un contesto relazionale in cui il soggetto deve essere adeguatamente

motivato e chi somministra il test si comporta in modo abbastanza neutrale. Se questa relazione è

troppo asettica può non essere motivante per il soggetto; se al contrario è troppo intensa può

influenzare la prestazione del soggetto.

3. Utilizzazione con soggetti problematici:

in questi casi bisogna:

• Assicurarsi che il soggetto comprenda le richieste;

• Aumentare il numero di esempi e di eventuali esercizi di pratica; 2

• Dare più rinforzi e incoraggiamenti;

• Programmare sedute brevi;

• Non forzare il soggetto se manifesta rifiuti a certi item;

• Tenere conto nella valutazione di elementi di ansia o affaticamento eccessivo.

In certi casi questi accorgimenti non possono essere applicati senza alterare i principi fondamentali dei

test psicometrici sopra delineati. In situazioni del genere si suggerirà un testing dinamico o un’analisi

qualitativa.

2. LA PSICOMETRIA

1. LA COSTRUZIONE E “TARATURA” DEL TEST

Il lavoro di costruzione e taratura è essenziale per definire un buon test, e questo lavoro va svolto

preliminarmente da chi costruisce il test.

Gli item vanno scelti con cura, magari con prove preliminari, perché rappresentino l’area psicologica da

valutare e siano graduati in modo opportuno. È opportuno iniziare dalle prove più facili nei test cognitivi e

da quelle più accettabili e meno “scabrose” nei test di personalità.

Lo scopo nella costruzione degli item è evitare che la risposta del soggetto risenta di un errore che inficia la

valutazione in quanto non consente di stimare adeguatamente competenze o condizioni “vere” del

soggetto stesso.

1.1 PUNTEGGI VERI E COMPONENTE DI ERRORE

Ciò si traduce in una semplice formula che permette di distinguere, nella risposta del soggetto, una

componente di variazione vera e una di errore, spuria rispetto alla prima:

• Variabilità vera: dipende dalla maggiore o minore capacità del soggetto di rispondere effettuando la

prestazione richiesta o di riferire dei suoi stati interni.

• Errore: può dipendere da varie cause, relative sia alla frase di costruzione del test che a quella di

somministrazione. Può dipendere inoltre da ragioni del tutto casuali e imprevedibili. Ciascuna di

queste cause di errore può essere ridotta nella costruzione del test e nella somministrazione.

Alcune fonti di errori potrebbero essere in realtà sistematiche, producendo quello che si definisce bias: la

deformazione della misura è sempre costante e in una certa direzione.

Presumere che queste fonti di errore siano del tutto abolite sarebbe utopico;

Si può conoscere a priori quanto il test nel suo complesso è soggetto alla componente di errore, in modo

da poter stimare il punteggio vero, che sarà compreso in un range attorno a quello reale più o meno ampio

in base all’errore di misurazione.

L’assunzione di base è che la media degli errori di misurazione sia zero, perché gli errori casuali tendono ad

annullarsi a vicenda nei grandi numeri, pur restando ovviamente presenti e incidenti nel singolo caso.

2. QUANDO UN TEST È AFFIDABILE? TEORIE CLASSICHE E NUOVI APPROCCI

Un test è affidabile quando è elevata la sua attendibilità, cioè l’accuratezza e la precisione con cui la

variabile è misurata riducendo per quanto possibile gli errori di misurazione.

Nei termini della variabilità di errore della prestazione al test prima ricordata, l’attendibilità può essere

definita come la proporzione di variazione vera rispetto a quella totale, che include anche quella di errore.

L’errore (che corrisponde alla deviazione standard della distribuzione delle componenti di errore della

misura) può essere usato per determinare entro quale ambito può trovarsi il punteggio reale, tenendo

conto appunto del margine di errore di misurazione. 3

L’uso pratico dell’attendibilità per stimare il range entro cui il punteggio reale si colloca è importante per

conoscere quanto errore potrebbe avere la nostra misurazione, e quindi quanta cautela occorre per

interpretare il punteggio ottenuto.

2.1 MODI DIVERSI PER STIMARE L’ATTENDIBILITÀ

La stima effettiva dell’attendibilità di un test si può ricavare in vari modi:

1. Attendibilità fra i valutatori: far valutare gli stessi protocolli da più persone e correlare i punteggi

assegnati. Più alta è la correlazione, meno incide l’errore di misurazione dovuto allo scoring.

2. Ripetizione (test-retest): ripetere il test sugli stessi soggetti, a distanza non tanto breve che i soggetti

possano ricordare le prove, ma neppure tanto distante da consentire variazioni dovute ad altri fattori.

La correlazione fra le due somme costituisce il coefficiente di attendibilità test-retest, detto anche di

stabilità.

3. Forme parallele: quando la ripetizione dello stesso test non è possibile, si procede confrontando due

versioni parallele del test: ad esempio due parti derivate da una versione inizialmente più lunga e poi

separata, oppure una forma analoga per contenuti, per lunghezza, per difficoltà.

4. Divisione a metà (split-half): dividere a metà il test e confrontare le due metà per verificare se

misurano la stessa cosa. Si ricorre alla visione per item pari-dispari. La somma dei punteggi viene

confrontata, ottenendo così un coefficiente di correlazione che quantifica l’attendibilità con questo

metodo, detto coefficiente di equivalenza.

Considerato che questo viene calcolato sulla metà degli item, è opportuno apportare una correzione

che rapporti il valore ottenuto all’effettiva lunghezza del test, mediante la formula di Spearman-

Brown.

5. Consistenza interna: calcolare quanto i diversi item che compongono il test siano omogenei tra loro e

col punteggio totale. Questa coerenza interna del test si può misurare mediante l’Alpha di Cronbach,

che confronta la somma delle varianze di tutti gli item con la varianza totale. Il presupposto è che la

varianza del test corrisponderebbe alla somma delle varianze degli item che lo compongono se non ci

fosse correlazione tra gli item; in tal caso sarebbe provato che gli item riguardano aspetti specifici e

quindi il test non è omogeneo.

Analogo scopo hanno le formule di Kuder-Richardson, diverse a secondo che gli item che

compongono il test siano a risposta dicotomica oppure abbiano un punteggio quantitativo. Anche in

questi casi non esiste uno standard fisso per considerare adeguato l’indice di consistenza interna. Una

regola intuitiva fissa tra .60 e .70 il margine di sicurezza per una sufficiente coerenza interna, in

mancanza della quale è bene rivedere l’impatto del test.

2.2 ITEM ANALYSIS SECONDO LA TEORIA CLASSICA

È possibile valutare il contributo specifico di ciascun item al totale del test.

Un metodo semplice è calcolare la correlazione tra ciascun item e il totale. Da questo viene di volta in volta

sottratto l’item stesso, per evitare che la presenza di questo nel totale inflazioni la correlazione.

La item-analysis serve pertanto a chi costruisce il test, o a chi lo revisiona, a ottimizzare l’attendibilità,

lasciando solo quegli item che contribuiscono meglio al punteggio totale e alla coerenza complessiva del

test. Serve anche a valutare quanto ciascun item è discriminante, basandosi sull’esame della variabilità,

che se troppo bassa segnala che tutti i soggetti tendono a rispondere allo stesso modo.

Al tempo stesso, una media troppo elevata o troppo bassa testimonia che l&rsqu

Anteprima
Vedrai una selezione di 4 pagine su 13
Riassunto esame Psicometria, Prof. Di Nuovo Santo, libro consigliato Misurare la mente, Di nuovo  Pag. 1 Riassunto esame Psicometria, Prof. Di Nuovo Santo, libro consigliato Misurare la mente, Di nuovo  Pag. 2
Anteprima di 4 pagg. su 13.
Scarica il documento per vederlo tutto.
Riassunto esame Psicometria, Prof. Di Nuovo Santo, libro consigliato Misurare la mente, Di nuovo  Pag. 6
Anteprima di 4 pagg. su 13.
Scarica il documento per vederlo tutto.
Riassunto esame Psicometria, Prof. Di Nuovo Santo, libro consigliato Misurare la mente, Di nuovo  Pag. 11
1 su 13
D/illustrazione/soddisfatti o rimborsati
Acquista con carta o PayPal
Scarica i documenti tutte le volte che vuoi
Dettagli
SSD
Scienze storiche, filosofiche, pedagogiche e psicologiche M-PSI/03 Psicometria

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher Sofiaa_123_ns di informazioni apprese con la frequenza delle lezioni di Psicometria e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Catania o del prof Di Nuovo Santo.
Appunti correlati Invia appunti e guadagna

Domande e risposte

Hai bisogno di aiuto?
Chiedi alla community