vuoi
o PayPal
tutte le volte che vuoi
Grafici per l’esame della normalità
Istogramma e polimero di frequenze
Test statistici per l’esame della normalità
Vi sono infine alcuni test statistici che consentono di esaminare se una variabile è normale
Ad esempio, il test di Kolmogorov-Smirnov (pp. 100-103) consente di valutare se la distribuzione
di frequenza osservata si discosta da una distribuzione teorica prescelta da ricercatore (es. la
distribuzione normale)
Il test si basa sul confronto tra la distribuzione di frequenza cumulata di un campione con la
distribuzione di frequenza cumulata prevista dalla distribuzione teorica di interesse
Il test di K-R verrà descritto dopo aver introdotto i concetti alla base della statistica inferenziale
Esaminare la normalità della distribuzione con SPSS
Gli indici di asimmetria e curtosi sono disponibili nelle finestre di dialogo «Frequenze» e
«Descrittive» (entrambi selezionabili dal menu «Analizza», procedura «Statistiche Descrittive»)
Dalla finestra di dialogo «Frequenze», gli indici di asimmetria e curtosi si possono richiedere
selezionando l’opzione «Statistiche»
Dalla finestra di dialogo «Descrittive», gli indici di asimmetria e curtosi si possono richiedere
cliccando su «Opzioni»
I grafici per l’esame della normalità sono disponibili nella finestra di dialogo «Frequenze»
(selezionabile dal menu «Analizza», procedura «Statistiche Descrittive»)
Come già visto in precedenza nel Modulo 2 («Le distribuzioni di frequenza»), dalla finestra di
dialogo «Frequenze» è possibile richiedere diversi tipi di rappresentazioni grafiche, selezionando
l’opzione «Grafici»
Per esaminare la normalità della distribuzione si può utilizzare l’istogramma
È possibile anche sovrapporre la curva normale all’istogramma
Proprietà della curva normale
Conoscendo la media e la deviazione standard della distribuzione è possibile calcolare la
percentuale (o proporzione) di casi compresi in un determinato intervallo di valori
Nella distribuzione normale è possibile definire diverse “regioni” della curva, in base alla distanza
dalla media, cui corrisponde una determinata percentuale di casi:
L’area compresa tra la media e 1 deviazione standard contiene circa il 34% dei casi
-∞ / -2σ = 2,15% μ / 1σ = 34,13%
-2σ / -1σ = 13,59% 1σ / 2σ = 13,59%
-1σ / μ = 34,13 % 2σ / ∞ = 2,15%
Le percentuali possono essere intese anche come probabilità di osservare un determinato punteggio
all’interno della distribuzione.
La probabilità è «la frequenza relativa con cui un determinato evento si verifica in un numero di
eventi sufficientemente grande» (definiz empirica o frequent)
La frequenza relativa è il rapporto tra il numero di volte in cui si verifica un evento e il
• numero totale di eventi
Il numero di volte in cui si verifica un evento viene definita «frequenza assoluta»
• Il numero totale di eventi è pari a n
•
La formula per il calcolo della probabilità (P ) di un evento si può dunque scrivere come:
P = Lim f/n
(n→∞)
Dove f rappresenta la frequenza assoluta dell’evento, e n rappresenta il numero totale degli
eventi osservati.
La probabilità, come anticipato, è pari alla frequenza relativa a condizione che il numero totale di
eventi sia sufficientemente grande.
Probabilità = numero eventi favorevoli
numero eventi possibili
Ma non si può applicare sempre, devo sapere numero di eventi possibili che devono essere loro
stessi probabili. Formula classica.
Principio della somma
La probailità di verificarsi di due eventi mutualmente escludentesi (A e B) è pari alla somma delle
probabilità dei singoli eventi.
P (AoB) = P(A) + P(B)
Principiodel prodotto
Probabilità che due eventi indipendenti si verifichino simultaneamente o in successione è pari al
prodotto delle probanilità di verificarsi dei due eventi.
P (A e B) = P(A) x P(B)
Due eventi sono indipendenti quando la probabilità di verificarsi di un evento non si modifica con il
verificarsi dell'altro evento
Se in due eventi non sono indipendenti (il verificarsi dell'uno modifica la probabilità di verificarsi
dell'altro), il principio del prodotto diventa:
P(AB) = P(A) x P(B/A)
Dove P(B/A) si legge probabilità condizionale di B una volta che si è verificato A
La probabilità è dunque un numero decimale compreso tra 0 e 1
La somma delle probabilità di tutti gli eventi possibili è pari a 1
La percentuale si ricava dalla probabilità moltiplicando quest’ultima per cento:
percentuale = probabilità X 100
La formula per calcolare la percentuale a partire dalla
frequenza assoluta è: percentuale = (frequenza assoluta /n) X 100
Tornando alla curva normale, come anticipato, se conosciamo media e deviazione standard è
possibile calcolare la «probabilità» di osservare un determinato punteggio all’interno della
distribuzione
Esempio: se una popolazione ha una distribuzione normale con M= 100 e ds= 15, la probabilità di
estrarre a caso da questa popolazione un punteggio che sia superiore a 130 è pari a circa .02
Per questo le distribuzioni in cui è nota la relazione tra i valori della distribuzione e la probabilità
che si verifichino (come ad esempio la normale) sono definite anche distribuzioni teoriche di
probabilità
La curva normale standardizzata
Un tipo particolare di distribuzione normale è la distribuzione normale standardizzata
La distribuzione normale standardizzata presenta le stesse caratteristiche delle altre distribuzioni
normali, ma ha media 0 e deviazione standard 1
Nel caso della distribuzione normale standardizzata la proporzione di casi che cadono in una
determinata porzione della curva normale può essere calcolata con maggior facilità
Queste proporzioni sono infatti tabulate (ovvero sono riportate in apposite tabelle)
68 – 95 – 99.7 2
Per qualsiasi distribuzione 1-1/k è compreso tra k deviazioni standarde la media
La standardizzazione
Lo scoring dei punteggi
Scoring procedura per arrivare a punteggio grezzo.
Si definisce punteggio grezzo la somma delle risposte fornite da un soggetto agli item di un test
psicologico.
Il punteggio grezzo non dà informazioni utili ed adeguatamente interpretabili
Pensiamo ad esempio ad un test di rendimento di 30 item
Un soggetto ottiene un punteggio pari a 23.
Quale è il livello di prestazione ottenuto dal soggetto? Dipende dal livello di difficoltà del test!
Come si fa a trasformare i punteggi grezzi in punteggi interpretabili?
Bisogna standardizzare i punteggi
Standardizzare significa riferire la misura ad una distribuzione standard, con media e deviazione
standard note
Punteggi z
La standardizzazione più comune è quella detta «standard» o in «punti z»
I punteggi espressi nella scala z hanno media = 0 e deviazione standard = 1
I punti z si ottengono trasformando i punteggi grezzi (osservati) con la seguente formula:
Pz = x – x
i
ds
Dove z è il punteggio standardizzato, x è il punteggio grezzo (osservato), x è la media dei punteggi
i
grezzi, ds è la deviazione standard dei punteggi grezzi.
Poiché si sottrae la media dal singolo punteggio:
Punti z positivi indicano che il punteggio del soggetto è superiore alla media del campione
• di riferimento. Ad esempio, il soggetto c (x=23), ha ottenuto un punteggio superiore alla
media del campione (z=1.00)
Punti z negativi indicano che il punteggio del soggetto è inferiore alla media del campione.
• Ad esempio, il soggetto h (x=14), ha ottenuto un punteggio inferiore alla media del
campione (z=-.50)
Il punteggio viene centrato attorno alla media, spostata unità di misura
Osservando il segno del punteggio z, sappiamo immediatamente se un punteggio è inferiore o
superiore alla media (ovvero al punteggio più rappresentativo della distribuzione)
Come “quantificare” gli scarti dalla media?
Esempio: la media della distribuzione è pari a 17. Il soggetto ha ottenuto un punteggio pari a 21,
quindi superiore alla media di 4 punti Quattro punti di distanza dalla media sono molti o
sono pochi? Dipende dalla deviazione standard
Poiché si divide per la deviazione standard:
La differenza dalla media viene “ponderata” in base al grado di dispersione dei punteggi
A parità di differenza dalla media:
- maggiore è la dispersione dei punteggi (ovvero maggiore è la deviazione standard), più il
punteggio z è basso
- minore è la dispersione dei punteggi (minore è la deviazione standard), più il punteggio z è elevato
Poiché si divide per la deviazione standard:
I punteggi vengono espressi in una nuova unità di misura, che è pari alla deviazione standard della
scala originale
L’utilizzo della deviazione standard come unità di misura è utile perché consente di quantificare
l’entità del singolo punteggio rispetto all’insieme di punteggi (collocare in distribuzione normale)
- Quando si utilizza un test psicologico, i punteggi standardizzati esprimono lo scostamento non da
un campione qualsiasi, ma dal cosiddetto campione normativo
- Il campione normativo è un campione molto ampio, le cui unità presentano caratteristiche
simili a quelle del soggetto cui è stato somministrato il test (età, sesso, ecc.)
- La somministrazione del test ad un campione normativo fa parte del processo definito di
“taratura” del test
Il punteggio del soggetto viene interpretato in base alla media e alla deviazione standard del
campione normativo (definite «norme» del test)
I punteggi standardizzati sono quindi ricavati utilizzando le norme del test nella formula per il
calcolo dei punteggi z
Ciò consente di interpretare adeguatamente il punteggio del soggetto
I punteggi standardizzati rendono inoltre uniformi le scale di test diversi, altrimenti non
confrontabili
I punteggi z in SPSS
Si possono calcolare dalla finestra di dialogo «Descrittive» (selezionabile dal menu «Analizza»,
procedura «Statistiche Descrittive»)
1. Selezionare la variabile e spostarla nel menu delle variabili attive
2. Selezionare l’opzione «Salva valori standardizzati come variabili»
3. Cliccare su «OK»
I punteggi z vengono calcolati per ciascun soggetto e salva