vuoi
o PayPal
tutte le volte che vuoi
Statistica descrittiva e inferenziale
La scienza statistica è comunemente suddivisa in due branche principali: descrittiva e inferenziale
- La statistica descrittiva ha come scopo quello di descrivere e sintetizzare i dati raccolti attraverso
indicatori statistici che descrivono gli aspetti salienti dei dati, o attraverso rappresentazioni
grafiche che ne facilitano la lettura
- La statistica inferenziale si occupa di trarre conclusioni riguardanti le popolazioni a partire
dall’osservazione di un campione. Consente di generalizzare alla popolazione, con un certo grado
di sicurezza, i risultati emersi in un campione
Popolazioni e campioni
Viene definita popolazione (o “universo”) l'insieme degli elementi cui si rivolge il ricercatore per la
sua indagine. A volte è impossibile o troppo costoso condurre una ricerca (somministrare un
questionario o effettuare delle interviste) sull'intera popolazione. In questi casi è opportuno
condurre l’indagine su una parte della popolazione, ovvero selezionare su un campione
Un campione è un sottoinsieme di una popolazione cioè una parte ridotta del complesso dei
soggetti ai quali, potenzialmente, l’indagine è rivolta
Popolazione: N elementi => Unità statistiche
Campione: n elementi => Casi
Metodi di Campionamento: rappresentano l’insieme delle operazioni che il ricercatore attua per
selezionare il campione dalla popolazione di riferimento
Campionamento casuale + di comodo (quelli più semplici da raggiungere)
Rappresentatività: E’ la capacità del campione di costituire un’ immagine su scala ridotta della
popolazione. Per campione rappresentativo si intende un campione che abbia tutte le più importanti
caratteristiche della popolazione da cui proviene. Il campione rappresentativo riproduce “in
miniatura” la popolazione
Solo se il campione è rappresentativo è possibile estendere alla popolazione i risultati (ovvero fare
inferenze rispetto alla popolazione)
Per ottenere un campione rappresentativo bisogna utilizzare determinate modalità di
campionamento (definite campionamento probabilistico)
Nei metodi probabilistici ogni unità statistica di cui è composta la popolazione ha una probabilità
nota di essere incluso nel campione
Parametri e indicatori
- Si definisce parametro la misura effettuata sulla popolazione (media, varianza, coefficiente di
correlazione)
- Si chiama invece indicatore o statistica la stessa quantità riferita ad un campione estratto dalla
popolazione
Notazione:
Si è soliti indicare i parametri con lettere greche, le statistiche con le lettere latine
Ad esempio, m (media) e s2 (varianza) sono i parametri, μ e σ2 sono le rispettive statistich
Si definiscono casi o (unità statistiche) ciò a cui si applica la misurazione: esseri umani, oggetti,
animali, eventi.
Con il termine variabile si fa riferimento a qualsiasi caratteristica (fisica o psichica) che può
assumere valori diversi in un dato intervallo. Una variabile è una caratteristica che, almeno
teoricamente, può essere misurata.
Alcuni modelli statistici distinguono tra variabili indipendenti e dipendenti: le variazioni nelle
var.dipendenti vengono considerate l’effetto delle variazioni nelle var. indipendenti
- Nei metodi sperimentali le var. indipendenti vengono manipolate, ovvero controllate e modificate
attivamente dal ricercatore. Es.: le dosi di un farmaco, l’intensità di una luce (var. indipendenti
sperimentali => decidere gruppo sperimentale e di controllo)
- Nei metodi non sperimentali le var. indipendenti non sono manipolate. In alcuni casi queste var.
esistono in natura, e non sono pertanto modificabili dal ricercatore. Es.: QI, età, orientamento
politico (var. indipendenti differenziali)
Codifica dei dati
Dopo aver raccolto i dati, e prima di iniziare qualsiasi trattamento statistico, i dati “grezzi”
devono essere riportati in appositi tabulati che ne rendono agevole la lettura.
Generalmente i dati vengono organizzati in una tabella chiamata matrice casi per variabili
Questa operazione viene definita codifica (o tabulazione) dei dati
Nella matrice casi x variabili:
Ogni riga rappresenta un caso, che viene identificato da un numero d’ordine progressivo
Ogni colonna rappresenta una variabile, ovvero una caratteristica che è stata rilevata sul
caso (es. il punteggio in un test)
All’incrocio tra ogni riga (unità) e colonna (variabile) ci sono le celle, che contengono i
valori ottenuto dal singolo caso sulla singola variabile
I test psicologici: cenni su attendibilità e validità
I test psicologici
Un test rappresenta un procedimento tramite il quale è possibile ottenere una “misurazione” di un
costrutto psicologico (es. atteggiamento, abilità mentale, tratto di personalità).
Può essere definito come l’applicazione di una procedura sistematica per l’osservazione e la
descrizione di un comportamento, che si serve dell’utilizzo di una scala numerica o di un sistema di
classificazione (Cronbach, 1970)
Dai comportamenti osservati è possibile fare delle inferenze circa i costrutti indagati con il test
(questi ultimi sono concetti astratti, non direttamente osservabili)
Gli item sono gli elementi minimali di un test (affermazioni, problemi da risolvere, frasi da
completare, stimoli da elaborare)
Test di Massima Performance
Test che misurano caratteristiche cognitive Il punteggio è dato dal livello di successo nel
completare correttamente ogni prova
Chiedono al soggetto di dare il meglio di sé, Test di Intelligenza + Test Attitudinali e di abilità +
valutano abilità raggiunte o potenziali Test di profitto
Test di Tipica Performance
Test che misurano le preferenze, i comportamenti I test di personalità, di interessi, di
abituali, il modo di essere e di comportarsi di un motivazione, le scale di atteggiamento, sono
individuo esempi di test di comportamento tipico
Non esistono risposte giuste o sbagliate I soggetti possono falsare le risposte (in
modo più o meno deliberato e consapevole
Attendibilità e validità
L’attendibilità di un test riguarda l’accuratezza con cui quest’ultimo misura un costrutto
psicologico
La validità di un test rappresenta il grado in cui esso misura effettivamente ciò che dovrebbe
misurare. La validità è dunque un concetto diverso dall’attendibilità: si può avere una misura
perfettamente attendibile ma senza alcuna validità. La validità è un concetto multidimensionale che
si articola in aspetti diversi.
Le scale di misura
Il termine misurazione fa riferimento alle procedure utilizzate per assegnare dei numeri agli
oggetti, in modo tale che le relazioni fisiche tra gli oggetti corrispondano alle relazioni aritmetiche
tra i numeri (isomorfismo)
Le regole tramite le quali i valori numerici sono assegnati agli oggetti determina il livello di
misurazione che viene ad essere definito
Stevens (1946) distingue quattro livelli di misura:
Nominale/Categoriale
• Ordinale
• A intervalli equivalenti
• A rapporti equivalenti
•
Scala nominale
È il tipo più semplice di scala: informa solo sull’uguaglianza/diversità di due casi
Classifica i casi in categorie (o modalità, o livelli): casi dello stesso tipo ottengono lo stesso valore,
casi di tipo diverso ottengono un valore diverso
I livelli sono costituiti da categorie discrete che non possono essere ordinate in alcun modo [non
viene fatto riferimento al maggiore o minore grado di presenza della qualità esaminata]
Esempio Genere: maschio, femmina
Ai livelli della variabile possono essere assegnati dei nomi (es. “maschio” e “femmina”), dei codici
astratti (es. “a” e “b”) o dei valori numerici (es. “1” e ”2”).
Anche quando vengono utilizzati dei numeri, comunque, questi rappresentano semplicemente
delle etichette che identificano i casi (es. 1 = “maschio”). In altri termini, viene utilizzata la sola
proprietà di simbolo del sistema numerico.
I casi devono essere classificati in un insieme di categorie:
a) Mutuamente escludentisi: ogni caso viene assegnato soltanto ad una categoria
b) Esaustive: tutti i casi vengono classificati nelle categorie utilizzate
Esempio di scala nominale
Supponiamo di essere interessati a «misurare» lo «stato civile» in un campione di 10 soggetti
Possiamo stabilire la regola di assegnare il numero 1 ai soggetti coniugati, 2 ai non coniugati, 3 ai
divorziati e 4 ai vedovi:
Casi Stato civile
A 1
B 2
C 4
D 3
Siamo interessati a «misurare» il genere sullo stesso campione. Decidiamo di assegnare “1” ai
maschi e “2” alle femmine
Questo tipo di scala di misura viene definita dicotomica poiché prevede due sole categorie
(Politomiche con più di due categorie). È il più basso livello di misura possibile
Casi Stato civile Genere
A 1 1
B 2 2
C 4 2
D 3 2
Le uniche proprietà della scala nominale sono quelle dell’equivalenza (tra i casi che appartengono
alla stessa categoria) e della non equivalenza (tra i casi che appartengono a categorie diverse) (=, ≠)
Le uniche statistiche applicabili a questo tipo di dati sono quelle che si basano sul calcolo delle
frequenze, ovvero il calcolo di quanti soggetti sono stati assegnati alle varie categorie (es. moda, test
del chi-quadrato => non parametriche)
Stato civile f
1 Coniugato 4
2 Celibe 3
3 Divorziato 1
4 Vedovo 2
Genere f
1 Maschio 5
2 Femmine 5
Scala ordinale
Nelle scale ordinali i livelli, oltre ad essere diversi, sono anche ordinati
Queste scale implicano l'assegnazione di numeri ai casi in modo che essi riflettano l'ordine di
graduatoria rispetto all'attributo in esame
Oltre all’equivalenza/non equivalenza viene quindi stabilita una relazione di ordine
Questo ordinamento viene definito «graduatoria»
La posizione del singolo caso nella graduatoria viene definita “rango” o "ordine di rango"
Il numero che viene assegnato ai casi non corrisponde alla quantità della caratteristica posseduta,
ma indica una relazione d’ordine tra le quantità (es. più grande di, superiore a, etc.)
Regola di assegnazione dei numeri:
I casi cui viene assegnato il numero 1 presentano una quantità maggiore della caratteristica
• rispetto ai casi cui viene assegnato il 2, etc.
I casi cui viene assegnato lo stesso numero presentano la stessa quantità della caratteristica
•
Esempio di scala ordinale
Supponiamo di ordinare cin