Cap.1 Problema della misurazione in psicologia: prospettiva storica
La psicologia è lo studio della mente; la psicometria invece è un aspetto specifico dello studio della mente, che cerca di misurare la mente, quindi è un obiettivo molto difficile se pensiamo alla complessità della mente. Ma cosa importante su cui fare attenzione è quella di creare distinzione tra psicometria ingenua e psicometria. La prima consiste in un tentativo spontaneo e del tutto ascientifico di verificare la presenza di una caratteristica psicologica in una unità di analisi (soggetti).
La psicometria, fu definita una caratteristica psicologica, si basa su comportamenti osservabili, che devono essere rilevate non solo basandosi su presenza/assenza del comportamento ma anche intensità e frequenza. La psicometria si occupa dello sviluppo di test psicologici e sulla ricerca di metodi oggettivi di misurazione oggettiva delle variabili psicologiche utili all’assessment psicologico degli individui.
Chi definì la misurazione in psicometria fu Stevens, egli fu anche colui che ha introdotto le scale di misurazione (nominale, ordinale, a intervalli e a rapporti equivalenti) per lui, la psicometria (misurazione in psicologia) consiste in una serie di regole per assegnare dei numeri agli oggetti in modo da rappresentare numericamente la quantità di attributo presente in oggetto (scaling) e stabilire in quale in quale categoria gli oggetti cadono rispetto a un dato criterio (classificazione) attraverso procedure di scaling ha reso in numero dei concetti astratti psicologici.
Altro importante fu Thomson noto come Lord Kelvin che raccoglie il motto di Galilei “Conta ciò che è contabile, misura ciò che è misurabile e rendi misurabile ciò che non lo è”. L’obiettivo della psicometria secondo lui è trasformare in numeri i costrutti psicologici, attraverso regole. In psicologia, la valutazione e misurazione non possiede strutture additive, cioè non possiamo dire quanto manca a una persona che ha un Q.I di 100 per raggiungere uno di 160, perché anche se i soggetti possiedono uguale Q.I in realtà non potranno mai essere intelligenti perfettamente lo stesso modo.
Connessione tra sistemi relazionali
In psicologia abbiamo la connessione tra 3 sistemi relazionali che sono implicati nella misurazione:
- Sistema relazionale numerico → Regola → Sistema relazionale empirico
- Relazione teorica → Regola → Sistema numeri → Regole → Indicatori osservabili psicologici → Regole → Variabili
Infatti noi in psicologia dobbiamo trovare indicatori osservabili dei costrutti teorici per misurare costrutti astratti quali ansia, stress, ecc. L’attributo astratto va trasformato in termini empirici (pratici, direttamente osservabili) ciò comprende la definizione e l’operazionalizzare, la definizione del costrutto teorico deve essere chiara per far sì che gli indicatori si riferiscano solo a quel costrutto e non altri.
Utilizzo dei test psicologici
Il test è uno strumento che ci serve per comprendere meglio, e ci permette di fare inferenze sulle caratteristiche psicologiche di un soggetto. A tal proposito Anastasi disse che i test e gli strumenti psicologici, sono strumenti che consistono in una misurazione obiettiva e standardizzata di un campione di comportamenti che corrispondono all’attività psichica, infatti secondo Anastasi obiettività e standardizzazione sono i requisiti necessari per garantire il carattere scientifico della misurazione.
Le categorie/unità di misura di un comportamento sono:
- Latenza (tempo che intercorre tra presentazione dello stimolo e risposta comportamentale)
- Frequenza (permette di contare quante volte si presenta un determinato comportamento)
- Durata (quanto un comportamento dura nel tempo)
- Intensità (forza di un comportamento)
Questi criteri vengono utilizzati anche nel self-report (autovalutazioni). Le caratteristiche psicometriche sono due: attendibilità (che consiste nel quanto il test è affidabile e in grado di fornire gli stessi risultati in tempi diversi) e validità (quanto lo strumento misura ciò che dice di misurare). Queste caratteristiche rendono i test obiettivi e standardizzati. Spesso si tende a identificare un assessment psicologici, alla scelta di un test. I due non sono analoghi, ma i test sono una parte dell’assessment, che consiste in una valutazione dell’individuo che permette di descrivere la condizione psicologica dell’interessato, fare diagnosi e proporre prognosi, si basa sulla somministrazione di test, ma non esclusivamente a quella: osservazioni comportamentali, checklists, ambiente socio-culturale, interviste e documenti.
Oggetto e proprietà della misurazione
Quindi in psicometria ciò che si misura è detto:
- Oggetto/unità d’analisi (soggetto, studente, paziente).
Ciò che viene misurato:
- Attributo/caratteristica psicologica/proprietà è una caratteristica che può manifestarsi in almeno due modi ed è detta variabile, in un solo modo è detta costante. Una caratteristica misurabile è la quantità ma c’è un dibattito sul fatto che possa esserlo anche la qualità.
La misurazione in psicologia è stata un dibattito fin dal passato a tal fine molti sono stati gli psicologi che si sono prodigati. Ad es. Stevens/Thomson. Altro contributo allo sviluppo della teoria della misurazione fu dato da Spearman con il suo lavoro sull’intelligenza, egli indicava con il termine “g” il fattore generale d’intelligenza e con il termine fattore specifico le varie abilità spaziale/aritmetico/linguistico. Anche Cattell, come Spearman, riteneva che la psicologia non potesse raggiungere i livelli di certezza delle scienze fisiche a meno che non si basasse sull’esperimento e sulla misurazione. Fu uno dei primi ad utilizzare i mental tests. Thorndike riteneva che qualunque cosa esista lo fa in una certa quantità e che qualunque tratto mentale in qualunque individuo è una quantità variabile.
Primi passi per la misurazione
- Definire il costrutto (variabile psicologica latente)
- Operazionalizzazione del costrutto (indicatori osservabili o variabili manifeste)
I test hanno ruolo fondamentale in molti ambiti professionali: per definire diagnosi e trovare prognosi, orientamento e counseling, ambito forense, selezione del personale, psicologia del lavoro, ecc. Un test si divide in:
- Manuale di un test consiste nella guida all’uso di un test che contiene le istruzioni per il suo utilizzo.
- Materiale stimolo consiste nella parte pratica del test domande, esercizi, giochi, tavole, ecc.
- Foglio di notazione checklist in cui vengono segnati i risultati, fogli precostituiti in cui si possono segnare note o risultati.
- Griglia di correzione decodifica le risposte e le trasforma in numeri.
Cap. 2 La costruzione dei test psicologici: i primi passi e le tecniche di scaling
Per la costruzione di un test il primo passo in assoluto consiste nel chiedersi: cosa voglio misurare? In risposta a questa domanda devo:
- Definire il costrutto teorico che voglio andare a misurare. Deve essere definizione chiara. Alcuni costrutti potrebbero avere simili denominazioni, per questo è necessario, non avere una definizione poco chiara o non del tutto esplicativa. Ad esempio nella macroarea del concetto più generale di “fobia sociale” Mattick e Clarke hanno differenziato due tipologie: fobia sociale in cui è presente ansia e paura di essere osservati o guardati dagli altri, mentre si fa una normale azione di routine. Ansia da interazione sociale, costrutto simile che potrebbe sembrare uguale, in cui è presente disagio nell’incontrare e nel parlare con gli altri, per paura di essere incapaci di esprimersi, noiosi, di essere ignorati ecc.
Quindi per costruire un test che misuri ciò che desideriamo, è necessario riuscire a dare una definizione precisa e dettagliata (chiara) del costrutto che il test si propone di misurare, rifacendoci anche all’analisi della letteratura.
- Operazionalizzazione del costrutto teorico consiste nel processo di individuazione dei comportamenti osservabili, che ci permettono di rilevare la presenza di una caratteristica psicologica in una persona. Seconda Bridgman: “Legare i concetti scientifici ad operazioni che chiunque può osservare, o eseguire”.
Le operazionalizzazioni sono dunque gli indicatori osservabili di una variabile psicologica latente (costrutto). (È proprio questo che distingue la psicometria da quella ingenua senza sapere cosa intendiamo quando nominiamo una caratteristica psicologica, come facciamo a operazionalizzarlo?) inoltre un test con lo stesso nome non necessariamente spesso misura lo stesso identico costrutto.
- Dominio di contenuto consiste, una volta che abbiamo definito il costrutto, nel definire all’interno di un universo di comportamenti dei campioni di comportamento che possono operazionalizzare il costrutto a cui ci stiamo riferendo. A tal fine bisogna però stare attenti perché: spesso uno stesso comportamento può essere considerato un indicatore di costrutti diversi. Stare attenti negli strumenti a single-item measures, ad oggi alcuni autori hanno provato a utilizzare misure con un singolo indicatore (es; quanto sei felice da 1 a 7? Per misurare la felicità) è un rischio perché c’è il pericolo che il single-item in questione sia un indice per misurare anche altri costrutti.
Inoltre nell’immaginario collettivo si pensa (più item) quindi più è lungo il test più info abbiamo, non è proprio così poiché spesso lunghi test possono portare il soggetto ad annoiarsi, quindi bisogna trovare una giusta via di mezzo. Maggiore è l’ampiezza concettuale del costrutto da definire più è probabile che alcune operazionalizzazioni tendono a formare gruppi specifici di comportamenti. Queste sfaccettature del costrutto sono dette facets. Quando un costrutto è definibile in base a una serie di facets è chiamato dominio. Quindi ricapitolando per definire il dominio di contenuto, occorre selezionare un campione di operazionalizzazioni che sia rappresentativo dell’universo da cui è tratto.
Capita che non sempre riusciamo a operazionalizzare direttamente i costrutti e dobbiamo servirci di altri costrutti legati in qualche modo tra loro, che ci aiutano a differenziare le eventuali sfaccettature del costrutto. Il problema al quale si incorre è che ci sia un campionamento impreciso del contenuto cioè è importante che gli indicatori siano rappresentativi di tutti i Facets, altrimenti il test non può misurare ciò che ci si era posti in partenza.
Definire l’obiettivo/scopo del test
Lo scopo di un test di screening è quello di identificare precocemente i potenziali soggetti a rischio così da cominciare il prima possibile il lavoro di prevenzione o trattamento. I test si suddividono in:
- Test orientati al criterio: hanno o scopo di identificare particolari gruppi di soggetti in base al punteggio (es. le sedi cliniche che dicono che un soggetto è ansioso o no in base al punteggio)
- Test orientati al costrutto: valutano un costrutto sulla base di presupposti teorici (alla teoria).
I limiti possono essere che un test orientato eccessivamente al criterio rischia di avere limitata applicabilità, mentre un test orientato al costrutto, che nonostante sarà utilizzabile in una varietà di contesti, i limiti qui sono principalmente teorici perché risultati dell’ambito teorico nel quale è stata sviluppata.
Scaling
Lo scaling è quel processo che ci permette di ottenere la misura quantitativa di una variabile psicologica (non direttamente osservabile), ha come esito l’assegnazione a un individuo di un numero che indichi il grado in cui lui o lei, possiede la caratteristica che il test si propone di misurare. Possiamo riconoscere tre diverse tipologie di scaling:
- Scaling “classico” centrato sui soggetti (o teoria classica dei test): i primi risultati si ebbero nel lavoro di Spearman sulla misura dell’intelligenza, in cui egli introdusse i concetti di fattore generale (comune) e fattore specifico, che rappresenta il contributo di cause specifiche a una determinata prova, da qui l’equazione. L’assunto dello scaling “classico” è che la causa della variabilità delle risposte è attribuibile alle differenze individuali tra i soggetti, senza prendere in considerazione l’altro elemento fondamentale del test, cioè la prova che lo compongono.
La nota teoria classica dei test (TCT) parte dal presupposto che la variabile latente abbia un effetto casuale sulle variabili osservate. Cioè X=V+E cioè il punteggio osservato nell’item (o test) = V (punteggio vero) cioè l’effettivo contributo dell’effetto causale del costrutto nel determinare il punteggio osservato) +E detto errore di misurazione (che raccoglie tutte la cause possibili, esterne al costrutto.) È possibile all’interno della TCT (scaling sui soggetti) avere due tipologie di modelli di misurazione:
- Reflective indicator measurement model: indicatori riflessivi del costrutto
- Casual (formative) indicator measurement model: indicatori formativi del costrutto (che lo causano)
Premettendo che questa è una divisione prettamente teorica. Secondo questo tipo di scaling la causa della variabilità delle risposte è attribuibile alle differenze individuali tra i soggetti non negli item che compongono il test.
- Scaling centrato sugli stimoli: il cui obiettivo non è misurare gli individui ma gli stimoli. Thurstone ad esempio propose un metodo per la misurazione dei valori sociali che si basa sulla quantificazione della gravità di alcuni tipi di reato (quantificazione di stimoli in questo caso di reati; su un continuum quantitativo per determinare ordine e distanze). A tal fine Thurstone utilizzò il metodo dei confronti a coppie (method of paired comparisons) che prevede inizialmente che tutti gli stimoli da valutare vengano elencati, poi presenta ai soggetti una lista di coppie di crimini e dice loro di sottolineare quello più grave. Il numero totale di coppie è n=(n-1)/2= 171, ogni crimine compare un egual numero di volte come primo e come secondo elemento della coppia: poi si calcola la percentuale di volte che un elemento viene scelto.
Ogni soggetto ha una propria valutazione tipica del crimine che non è immutabile, quindi in alcune occasioni tenderà a considerarlo più grave in altre meno. Thurston afferma che queste fluttuazioni sono minime e tendono a seguire la distribuzione di probabilità, normale. (Punti Z: o punteggio Z o punteggio standardizzato, consistono nel confronto tra la media della distribuzione normale e il singolo punteggio).
Limiti dello scaling centrato sugli stimoli:
- I risultati sono molto vincolanti alla tipologia di soggetti ai quali vengono somministrati (per via di una eventuale difficoltà di generalizzazione)
- È vincolata dagli item inseriti, la scala proposta da Thurstone fu proposta negli anni 20 ad oggi alcuni di quei crimini potrebbero non essere intesi più come reati.
- Scaling centrato sui soggetti e sugli stimoli: si basa sul fatto che le risposte agli item sono dati in parte in funzione della difficoltà degli item, e in parte dalle abilità del soggetto. È una nuova modalità per creare test. Louis Guttman pose un modello di misurazione deterministico, basato sul principio che un insieme di item possono essere considerati una scala. Quindi secondo questo modello, un soggetto che non sa rispondere alle domande più facili, non dovrebbe riuscire neanche con le più difficili.
Modello di Rasch: George Rasch invece ha posto il problema della misurazione psicologica in termini probabilistici, cioè una persona che ha un’abilità maggiore di un’altra persona, dovrebbe avere probabilità a rispondere correttamente a uno specifico item rispetto a quella persona, mentre se un item è più difficile di un altro significa che per ogni individuo indipendentemente dalle sue abilità la probabilità di rispondere correttamente all’item più facile è maggiore.
Questo approccio in cui la risposta all’item è funzione sia del grado di abilità posseduta dal soggetto sia dalla difficoltà dell’item è detto IRT (Item Response Theory = teoria della risposta all’item). Lo scopo fondamentale dei modelli IRT è ottenere una stima delle abilità del soggetto (del suo livello del costrutto misurato dal test) indipendentemente dalla difficoltà dell’item.
Obiettivo che guidò Rasch fu ottenere una misura di una caratteristica psicologica con tre specifiche proprietà degli IRT:
- Oggettività specifica: le misure ottenute dipendono sia dagli item che dal gruppo usato per verificare le proprietà psicometriche.
- Sufficienza: il conteggio delle risposte corrette al test è sufficiente per determinare il livello di difficoltà dell’item, e il livello di correttezza degli individui.
- Separabilità: è possibile distinguere gli effetti dovuti alle persone e quelli dovuti all’item.
- Indipendenza locale: aggiunta successivamente, quando la variabile latente viene mantenuta costante i punteggi degli indicatori osservabili sono tra loro indipendenti (proprietà non specifica solo dei modelli di Rasch, comune a tutti i modelli di misurazione di tratti).
Rasch si pose il problema della concatenazione avendo ben presenti i problemi inerenti la misurazione. La concatenazione consiste nel fatto che dati due soggetti A e B possiamo stabilire che rispetto a una certa proprietà A>B, ciò che però non siamo in grado di fare è dire quanta caratteristica deve essere aggiunta a B per raggiungere A.
Rasch ricorre all’analogia tra la misurazione psicologica e il concetto di accelerazione in fisica.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
-
Riassunto esame Psicometria , Prof. Cuturi Luigi Felice, libro consigliato Fondamenti di psicometria , Carlo Chiorr…
-
Riassunto esame Psicometria, Prof. Isolani Stefano, libro consigliato Teoria e tecnica psicometrica: costruire un t…
-
Riassunto esame Fondamenti di psicometria, prof. Faraci, libro consigliato introduzione alla psicometria, Primi, Ch…
-
Riassunto degli approfondimenti di psicometria, Prof. Chiorri, libro consigliato Teoria e tecnica psicometrica