vuoi
o PayPal
tutte le volte che vuoi
MATRICE DEI DATI
Si intende una tabella di almeno due dimensioni che contiene informazioni interpretate e codificate.
Si dicono dati/valori i contenuti di ogni cella. Si definisce anche matrice CxV (casi x variabili).
(In SPSS: statistica, riassumi, frequenze)
ANALISI DEI DATI
L’applicazione delle procedure statistiche serve per ridurre in modo sintetico la quantità di dati
raccolti e mostrare le relazioni più significative tra le variabili e trovare criteri di lettura dei
fenomeni studiati. Se la ricerca è di tipo esplorativo, si iniziano ad analizzare le variabili prese
singolarmente, si possono mettere in relazione tra loro sia rimanendo a livello descrittivo che
ipotizzando l’esistenza di relazioni di dipendenza o di causa-effetto passando così ad un piano
esplicativo. Infine si può ipotizzare che queste relazioni siano attribuibili a proprietà latenti che non
si sono considerate e si passa ad un livello di interpretazione in cui si cercano variabili latenti che
possono governare i fenomeni osservati. I due piani (descrittivo ed esplicativo) non sempre sono
scindibili: quando si utilizzano tecniche di analisi descrittive il più delle volte si fornisce
un’implicita interpretazione dei dati.
Data editor: compare immediatamente all’attivazione di SPSS e permette di introdurre dati o di
richiamare dati già immagazzinati in un system file per analizzarli o correggerli.
Finestra di output: in cui vengono inviati i risultati delle procedure in esecuzione e gli eventuali
messaggi di errore.
Finestra grafici: attuata automaticamente dal programma quando si richiedono procedure di analisi
grafica.
Finestra di sintassi: aperta quando si vuole scrivere un programma di istruzione SPSS.
DESCRIZIONE
Raccontare ciò che si osserva sia considerando le variabili singolarmente sia valutandone la
covariazione a due a due senza stabilire un rapporto causa-effetto, sia studiando l’intreccio di
relazioni tra più variabili con l’intenzione di formulare una sintesi. Una buona descrizione
9
scaturisce da un efficace equilibrio tra osservazione generale e particolare (troppi dettagli o troppo
facili da generalizzare rendono inutile una descrizione); per quanto ogni ricercatore voglia essere il
più possibile imparziale nel riportare i risultati, li descriverà e in parte li trasformerà in informazioni
utilizzando i propri criteri di rilevanza.
SPIEGAZIONE
Analisi sulle entità osservate e ipotesi su relazioni che possono intercorrere tra loro. Spiegare
significativa mettere in relazione un effetto (variabile dipendente) con una o più cause (variabile
dipendente). Ciò che si ipotizza e non si può direttamente rilevare è la relazione diretta di causa e
effetto tra due o più fenomeni. L’ipotesi di casualità è introdotta dal ricercatore a partire da una
covariazione di fenomeni (con l’aumento di una aumenta la seconda variabile). Nella covariazione
le due variabili assumono valori diversi in modo parallelo ma ciò non implica necessariamente una
causalità. La causa include anche l’elemento di direzionalità dell’azione e il legame diretto (il
variare di una variabile è dovuto e non solo associato al variare dell’altra).
INTERPRETAZIONE
Spiegare ciò che appare il risultato di meccanismi nascosti che possono essere osservabili più o
meno direttamente.
ANALISI MONOVARIATA
Descrizione mediante variabili categoriali
Per trattare le variabili singolarmente con uno scopo descrittivo si deve distinguere tra categoriali (si
inizia di solito con l’analisi del calcolo delle frequenze), ordinali, cardinali (analisi media e
dispersione).
Calcolo frequenze
Le tabelle di frequenza (o tavole di contingenza) sono lo strumento più comune per descrivere dati
che si distribuiscono all’interno di un numero limitato di categorie.
(SPSS: statistica, riassumi, frequenza)
la prima colonna mostra le etichette delle modalità delle variabili, la seconda il numero di codifica
delle modalità, la terza il numero di soggetti che ha scelto quella modalità, la quarta la percentuale
sul totale (si ottiene dividendo la singola frequenza per il totale dei casi e moltiplicando x 100), la
quinta le percentuali calcolate sul totale dei casi validi escludendo i missing, la sesta le percentuali
cumulative calcolate sulla colonna delle percentuali dei casi validi.
Misure di tendenza centrale e dispersione
Per descrivere una variabile categoriale è possibile utilizzare la moda (valore della modalità con il
maggior numero di frequenze); solitamente si considera anche una misura di variabilità dei soggetti
intono a questo valore.
Descrizione mediante variabili ordinali
L’indicatore di tendenza centrale è la mediana (valore della variabile al di sotto e al di sopra del
quale si trovano rispettivamente il 50% dei casi); la misura di dispersione è data dalla distanza tra il
1° e il 3° quartine: tre valori che dividono la distribuzione ordinata in tre parti uguali (il 1° quartine
al di sotto del quale cade il 25% delle osservazioni, il 2° al di sotto del quale cade il 50% e il 3° al di
sotto del quale cade il 75%).
Descrizione mediante variabili cardinali
La misura di tendenza centrale è la media; le tabelle di frequenza non sono adatte per rappresentare
le distribuzioni di variabili cardinali e metriche che possono assumere molti valori, a meno che non
siano opportunamente raggruppate in un numero limitato di classi (SPSS: trasforma, ricodifica).
Per descrivere sinteticamente la distribuzione di una cardinale si usano media, dispersione e indici
di forma (Curtosis che indica se la distribuzione è appuntita o piatta rispetto alla distribuzione
normale e Skewness che indica la simmetria di una distribuzione: se i valori si distribuiscono su una
coda più lunga verso i valori piccoli è asimmetria negativa, al contrario è positiva). 10
Le misure di dispersione dicono quanto si discostano i dati dalla media: la varianza (più è bassa ,
più i casi si distribuiscono attorno alla media, più è grande e più i casi sono dispersi) e deviazione
standard.
Per descrivere la variabile è utile considerare anche i valori estremi (minimo e massimo) e il range
(valore massimo – minimo). SPSS: statistica, riassumi, descrittive.
La ricodifica delle variabili
Per poter fornire risultati più incisivi ed efficaci sintetizzando le informazioni, a qualsiasi livello di
scala, è possibile ridurre il numero di classi aggregando le modalità. SPSS: trasforma, ricodifica, in
variabili diverse (è consigliabile mantenere la variabile originaria e costruirne una nuova con i
valori ricodificati).
E’ utile per raggruppare in classi la variabile età degli intervistati utilizzando classi di ampiezza
equivalenti (per es. 10 anni) o disomogenee.
Rappresentazioni grafiche
La rielaborazione grafica dei risultati descrittivi è indispensabile sia per la stesura di un rapporto di
ricerca scritto che ai fini di una presentazione orale. I grafici possono rappresentare dati categoriali,
ordinali, metriche e conteggi.
ANALISI BIVARIATA
Dopo aver analizzato le variabili singolarmente di solito si vede come possono essere messe in
relazione tra loro attraverso la relazione bivariata:
Controllare l’esistenza della relazione: si può dire che esiste e non è amputabile al caso
quando si dispone di una statistica che ne stabilisce la significatività; il più noto test è il CHI
QUADRO che si usa con le categoriali e fornisce una misura di tipo inferenziale relativa
all’esistenza di una relazione.
Forza: quanto una relazione esistente è stretta, con quanta precisione la conoscenza dei
valori di una variabile permette di precedere i valori di un’altra ad essa associata. Viene data
dai test di associazione (più noto è il coefficiente di correlazione che si usa con le cardinali).
Forma: se la relazione è lineare o curvilinea; si studia con l’analisi grafica e tecnica di
regressione.
Direzione: modo in cui variano tra loro due variabili cardinali (se all’aumentare di una
diminuisce l’altra la relazione è negativa, se all’aumentare di una aumenta l’altra è positiva).
Simmetria-asimmetria: le variabili possono essere entrambe causa-effetto; una relazione è
definita asimmetrica quando è distinguibile facilmente una causa da un effetto.
Occorre inoltre valutare l’influenza eventuale di una terza variabile su una relazione a due:
Relazioni spurie: quando tra due variabili c’è covariazione in assenza di causazione; la covariazione
osservata va attribuita ad una terza variabile nascosta che agisce sulle due iniziali; quando le
variabili latenti sono osservabili si può controllare il loro effetto trasformandole in costanti e
suddividendo il campione. SPSS: dati, distingui, ripeti analisi per ogni gruppo
Relazioni soppresse: quando esiste nella realtà una relazione causale diretta tra due variabili, ma
non emerge da una prima analisi.
L’aspetto empirico – osservabile della causalità è la covariazione. Il concetto di causa è un concetto
teorico, sarà il ricercatore ad interpretare in termini esplicativi i risultati di un’analisi statistica; si
parla di spiegazione quando la relazione causa-effetto è diretta, si parla di interpretazione quando
interviene una variabile latente.
DESCRZIONE BIVARIATA
Un modo semplice per mettere in relazione due variabili, classificate in un numero limitato di
categorie, è di utilizzare le tabelle a doppia entrata (tavole di frequenza incrociata, o tabelle di
contingenza, cross tabulation). Per costruirla non è necessario identificare una dipendente e
un’indipendente. Gli unici requisiti sono: numero delle categorie di ogni variabile sia limitato e il
11
numero dei casi per ogni categoria sia sufficientemente ampio da riempire tutte le celle nella tabella
finale.
SPSS: statistica, riassumi, tavole di contingenza
Per avere le % di riga e colonna, ciccare sul pulsante celle nella videata tavole di contingenza e
attivare il calcolo delle % di riga e colonna.
Per capire se esiste effettivamente una relazione tra le due variabili, il test statistico più utilizzato è
2
il CHI QUDRO (X ) che varia tra 0 (non c’è relazione) e 1 (massima relazione). In SPSS si
seleziona da statistiche, tavole di contingenza.
Se non c’è relazione i casi si distribuiscono all’interno delle celle in modo indipendente,
mantenendo le proporzioni che i marginali hanno tra loro. Se esiste una relazione Il Chi assume un
valore positivo diverso da zero, ma perché tale valore sia significativo occorre che non sia dovuto al