vuoi
o PayPal
tutte le volte che vuoi
VEDI ESEMPI PARAGRAFO 8.5: SCELTA DI INDICATORI
La costruzione di indici tipologici con variabili categoriali e ordinali
L’intensione di un concetto ha vari aspetti, e se non è possibile definire operativamente quel concetto in
forma diretta occorre trovare degli indicatori.
Le informazioni raccolte devono essere poi sintetizzate per ricostruire in qualche modo l’unità del concetto.
L’operazione con la quale si realizza questa sintesi si chiama costruzione di un indice.
Il criterio di costruzione degli indici si può stabilire in astratto, nel momento in cui si designa la ricerca; ma
prende corpo quando i dati sugli indicatori sono stati raccolti e codificati nella matrice. Il procedimento che
si segue è diverso a seconda che si trattino le variabili come cardinali o meno.
Se consideriamo le variabili che formeranno l’indice come categoriali o ordinali si attribuisce autonomia
semantica alle loro categorie. Ne consegue che lo strumento per realizzare la sintesi è la tabella di
contingenza, nella quale le categorie di una variabile sono riportate nelle righe e quelle dell’altra variabile
nelle colonne. In ogni cella c’è un tipo cioè la combinazione delle categorie. Questi tipi di indici sono detti
tipologici.
ES. abbiamo due variabili ordinali. La proprietà che ci interessa è il capitale culturale e che due indicatori
scelti siano il titolo di studio del padre e della madre, ognuno rilevato con quattro categorie:
elementare/medio/medio-superiore/superiore.
Questi tipi potrebbero essere le sedici modalità della nuova variabile ( 4 x 4 = 16 ). Il problema è che questa
variabile dovrà essere combinata con altri indicatori di capitale culturale. Sedici categorie sulle righe o
colonne sono decisamente troppe; per questo motivo è opportuno ridurre il numero dei tipi nella tipologia.
•Il codice 1 entrambi i genitori con titolo elementare;
•Il codice 2 almeno un genitore con titolo medio;
•Il codice 3 almeno un genitore con titolo medio-superiore;
•Il codice 4 almeno un genitore con titolo superiore;
•Il codice 5 entrambi i genitori con titolo superiore;
Si ottiene cosi una nuova variabile ordinale, che sintetizza i due indicatori.
Si combinano poi queste 5 tipologie con una variabile categoriale come ad esempio tipologia delle letture
preferite, mettendole in relazione nella tabella di contingenza.
Ogni volta che si vogliono combinare uno o più indicatori, la complessità semantica aumenta in modo quasi
esponenziale, le decisioni necessarie per ridurre la tipologia sono sempre più problematiche e il controllo
intellettuale sull’intera operazione e sui suoi risultati diminuisce. Per questo motivo, ogni volta che si
possono immaginare definizioni operative che creano variabili cardinali o quasi-cardinali, i ricercatori
esperti lo preferiscono.
La costruzione di indici sommatori con variabili cardinali e quasi-cardinali
Per due motivi costruire indici con variabili cardinali o quasi- cardinali è più semplice:
1.Il primo consiste nella possibilità di compiere con piena legittimità operazioni matematiche sui codici
numerici che rappresentano gli stati in queste variabili;
2.Il secondo riguarda la ridotta o nulla autonomia semantica delle categorie, che ci permette di passare da
un trattamento con tabelle, dove il fuoco dell’attenzione deve concentrarsi su ogni cella, a un trattamento
con diagrammi, dove l’attenzione può concentrarsi sull’andamento.
Dal punto di vista tecnico i procedimenti sono gli stessi; quello che cambia radicalmente è l’obiettivo del
trattamento. In un caso, stiamo costruendo variabili di maggiore generalità e portata teorica; nell’altro, le
variabili sono state costruite, e stiamo esplorando un segmento della fitta rete di relazioni tra loro.
Le operazioni matematiche necessarie per costruire indici a volte sono semplici somme di punteggi.
Naturalmente questo livello di semplicità si può raggiungere solo se sono soddisfatte quattro condizioni;
1.La condizione fattuale: cioè che non manchino dati su uno o più indicatori: se ne mancano, il punteggio
finale di ciascun caso nell’indice deve essere la media e non la somma dei suoi punteggi validi. Se si
sommasse, i punteggi finali di tutti i casi che hanno dati mancanti sarebbero indebitamente minori di quello
che dovrebbero essere. Spetta al ricercatore decidere quanti dati mancanti si possono accettare;
2.La condizione numerica: cioè che tutte le variabili che si sommano abbiano la stessa estensione di scala.
Questa vale per gli indici formati sia con variabili metriche, sia con variabili cardinali naturali, sia con
variabili quasi-cardinali.
3.Prima condizione semantica: immaginiamo che la federazione di atletica voglia inviare alle Olimpiadi
anche un decatleta. È risaputo che le prove del decatlon includono lanci, salti e corse. In questo caso, non ci
si può limitare a normalizzare i punteggi prima di sommarli. Questo perché nei salti e nei lanci più alta è la
cifra maggiore è il merito; per le corse vale ovviamente il contrario. Perciò si deve invertire la direzione dei
punteggi relativi alle corse;
4.Seconda condizione semantica: può succedere che un ricercatore consideri alcuni indicatori più validi di
altri, per motivi legati alla sua diretta conoscenza del problema e/o dell’ambito esaminato. Oltre al fatto
che una scelta di indicatori non può in alcun modo essere “oggettiva” si deve aggiungere che considerare
ugualmente validi tutti gli indicatori è un assunto indimostrabile. Per ponderare il contributo di ogni
indicatore il ricercatore ha due vie:
a. Può farsi guidare dalle sue valutazioni semantiche, moltiplicando i punteggi degli indicatori che considera
più validi per un coefficiente maggiore di 1 e gli indicatori che considera meno validi per un coefficiente
minore di 1;
b. Può sfruttare le possibilità che gli offre la matrice dei dati, sottoponendo l’insieme delle variabili che
operativizzano i possibili indicatore del concetto a un analisi delle componenti. Questa tecnica ha tre fasi:
1.Scegliere dei possibili indicatori quelli che hanno una relazione empirica con gli altri, e quindi un
apprezzabile rapporto semantico con il concetto;
2.Stimare la forza di questo rapporto semantico (validità);
3.Stabilire un coefficiente per ponderare i punteggi. L’indice finale è la somma dei punteggi di ogni individuo
sugli indicatori scelti nella fase 1;
CAPITOLO 9 – LE RELAZIONI FRA LE VARIABILI
A partire da questo capitolo affronteremo il problema di come si ipotizzano e si accertano le relazione fra le
variabili codificate in una matrice di dati.
John Stuart Mill si rese conto che per le situazioni in cui le variabili da tenere sotto controllo sono troppe
per i metodi della concordanza e della differenza, propose il metodo delle variazioni concomitanti. Per
variazioni concomitanti o covariazione fra le variabili A e B, si intende il fatto che a valori alti di A tendono
corrispondere valori alti di B e a valori bassi di A tendono a corrispondere valori bassi di B.
Tutte le tecniche di analisi dei dati alla fine dell’Ottocento erano relative alle sole variabili cardinali.
Fu George Udny Yule a sostenere che le variabili categoriali hanno natura diversa delle cardinali, e
richiedono un trattamento particolare con tecniche e coefficienti specifici. Yule ritenne opportuno
introdurre un termine più generale “associazione” che si riferisce alle relazioni fra variabili di qualunque
natura.
Relazione e associazione
Si parla di relazioni fra variabili in senso generale, quando si vuole accertare se ci sia o non ci sia
associazione. Quando la relazione esiste, ma non si specifica la natura delle variabili fra le quali esiste, si
parla genericamente di associazione. Il termine opposto è indipendenza (non c’è associazione).
Oltre all’esistenza o meno di un’associazione fra due variabili, applicando le opportune tecniche di analisi ai
dati di una matrice si può accertare la sua intensità, cioè il fatto che sia stretta o meno. Se entrambe le
variabili sono quantitative si può accertare il segno della loro associazione (positiva se a valori alti di una
corrispondono i valori alti dell’altra – negativa se a valori bassi di una corrispondono i valori bassi dell’altra).
Analizzando i dati di una matrice con il metodo dell’associazione non si può accertare la direzione della
relazione. Nella realtà sono possibili tre direzioni di questa relazione fra due proprietà:
1.Unidirezionale: la proprietà A influenza la proprietà B ma non ne è affatto influenzata. Esempio: l’età può
influenza qualsiasi altra variabile ma non ne può essere influenzata;
2.Bidirezionale asimmetrica: la proprietà A influenza la proprietà B più di quanto ne sia influenzata.
Esempio: il capitale culturale di un individuo influenza il suo tipo di occupazione, che però a lungo andare
può incidere sul suo capitale culturale;
3.Bidirezionale simmetrica: le due proprietà esercitano influenze reciproche della stessa intensità. Esempio:
se unità è l’individuo, la sua preferenza politica influenza quella del coniuge tanto quanto ne è influenzata.
Nella realtà, le relazioni unidirezionali sono più frequenti, ma sulla base dei dati registrati nella matrice,
tutte le relazioni non possono che apparirci bidirezionali simmetriche.
Tale direzione non può risultare dai meri dati: chi li analizzasse come semplici cifre, senza sapere a quali
variabili si riferiscono, non avrebbe alcun mezzo per stabilirla.
Sulla base dei dati registrati nella matrice, possiamo solo accertare se fra le variabili A e B esiste
un’associazione, e se è forte o debole.
I modelli
I modelli sono rappresentazioni grafiche delle nostre ipotesi sulle relazioni fra due o più variabili. Il modello
A<-> B è l’equivalente grafico della frase “si ipotizza che fra la variabile A e la variabile B intercorra una
relazione bidirezionale”.
Il modello A B è invece l’
eq
intercorra una relazione unidirezionale, nel senso che A influenza B mentre non ne è influenzata”
Si può stabilire se le variabili sono effettivamente associate, quantificare la forza di questa eventuale
associazione e, se non sono categoriali, stabilirne anche il segno.
Qualunque tecnica usiamo, possiamo controllare solo l’esistenza di un’associazione, quantificarne la forza e
se le variabili non sono categoriali, accertarne il segno; ma la direzione che il calcolatore attribuisce alla
relazione dipende dalla tecnica di analisi usata, e quindi dalle decisioni del ricercatore.
Nelle scienze sociali, tanto il modello unidirezionale tanto