Che materia stai cercando?

Riassunto esame Psicometria, prof. Areni, libro consigliato "Elementi di statistica per la psicologia", Ercolani, Areni, Leone

Riassunto per l'esame di Psicometria della prof. Areni (facoltà di Psicologia), basato su appunti personali e studio autonomo del testo consigliato dal docente "Elementi di statistica per la psicologia", Ercolani-Areni-Leone.
Gli argomenti trattati sono i seguenti:
- La quantificazione in psicologia
- Attendibilità e validità
- Variabili e mutabili
-... Vedi di più

Esame di Psicometria docente Prof. A. Areni

Anteprima

ESTRATTO DOCUMENTO

matematiche. La regola consiste nell’attribuire numeri uguali agli elementi appartenenti alla

stessa categoria, e numeri diversi ad elementi appartenenti a categorie diverse.

È quindi possibile includere nella categoria 1 i “maschi” e nella categoria 2 le “femmine”

1 = MASCHI

2 = FEMMINE

Con l’utilizzo di queste scale, è più corretto parlare di mutabili piuttosto che di variabili.

• S O : una prima forma di quantificazione. I soggetti ai quali viene assegnato lo

CALA RDINALE

stesso numero presentano la stessa quantità della caratteristica in esame. Inoltre, i soggetti ai

quali viene assegnato il numero 1 presentano una quantità della caratteristica maggiore rispetto

ai soggetti ai quali viene assegnato il numero 2, e così via. È quindi possibile rappresentare una

relazione di ordine tra le quantità (“maggiore di…”, “minore di…”), e formare un ordine di rango

tra i soggetti, ma è impossibile stabilire quanto i soggetti differiscano tra loro .

1 = CETO SUPERIORE

2 = CETO MEDIO

3 = CETO MEDIO-INFERIORE

4 = CETO SVANTAGGIATO

Se due soggetti ottengono un risultato identico, il rango attribuito a ciascuno dei due è la media

dei due ranghi che avrebbero occupato in graduatoria (se i soggetti si equivalgono in

posizione 3 e 4, si assegna loro la posizione 3,5, e al soggetto successivo si attribuisce la

posizione 5).

Le operazioni ammesse su queste scale includono il calcolo delle frequenze ed altri indici

statistici come mediana e correlazioni tra ranghi.

• S R E : misura quantitativa che aggiunge oltre alla relazione

CALA A APPORTI QUIVALENTI

d’ordine, il concetto di unità di misura costante, che permette di indicare l’esatta distanza tra

due soggetti. Le operazioni aritmetiche sono possibili non solo sulle differenze tra i valori della

scala, ma anche sui valori stessi. Esiste poi lo “zero assoluto”, ossia la totale mancanza della

caratteristica. Perciò, queste scale rilevano di norma misure di tipo fisico (tempo di reazione).

• S I E : ha un livello di misura inferiore alla scala a rapporti

CALA A NTERVALLI QUIVALENTI

equivalenti. Esiste un livello “zero”, ma è uno “zero arbitrario”, dato che non indica la mancanza

totale della caratteristica, ma è assegnato come valore minimo su una scala di valori che

costituiscono un continuum della caratteristica in esame (in una scala di intelligenza, un

individuo non può avere intelligenza=0). La costanza del rapporto tra gli intervalli permette di

applicare tutte le tecniche statistiche e le operazioni algebriche tra i punteggi e sulle

differenze tra i numeri.

È possibile passare da una scala di livello superiore a una di livello inferiore, ma non viceversa!

1.4 - FREQUENZA

F

La rappresenta il numero delle volte in cui si verifica un dato evento in un gruppo di

REQUENZA

altri eventi. La somma di tutte le frequenze F deve essere uguale a N, ossia al totale dei soggetti:

∑ =

F N F P

A volte è utile trasformare la distribuzione di frequenze in distribuzione di :

REQUENZE ERCENTUALI

⋅ ⋅

F N F 100

%

= =

F F %

100 N

Naturalmente, la somma di tutte le frequenze percentuali deve risultare pari a 100 .

F C

La ci dice invece quanti soggetti/osservazioni hanno un valore X ≤ X . Per

REQUENZA UMULATA i

ogni valore di X si calcola la somma delle frequenze fino a quel valore compreso.

i

L’ultima frequenza cumulata è necessariamente pari a N.

2 F

Allo stesso modo è possibile cumulare le frequenze percentuali, ottenendo delle REQUENZE

P C . La sola differenza è che l’ultima deve necessariamente essere pari a

ERCENTUALI UMULATE

100. X F F F% F%

i i cum cum

18 2 2 16.7 16.7

19 2 4 16.7 33.4

20 3 7 25.0 58.4

21 1 8 8.3 66.7

22 2 10 16.7 83.4

23 2 12 16.6 100.00

12 100.00

Considerando X=18, n = 2 soggetti hanno punteggio ≤ 18.

Considerando X=22, l’83,4% dei soggetti ha punteggio ≤ 22.

Se i diversi valori che X può assumere sono molteplici, è opportuno fare un ulteriore raggruppamento,

costruendo intervalli di ampiezza superiore a 1, cioè classi di valori che contengano più valori di

X.

Ad esempio, se X è l’età misurata su N = 30 soggetti, è possibile creare X F

degli intervalli che contengono ciascuno 2 valori di X. 18 3

19 3

20 4

21 6

22 5

23 4

24 3

25 2

30

CLASSI F

18 - 19 6 (3+3)

20 - 21 10 (6+4)

22 - 23 9 (5+4)

24 - 25 5 (3+2)

30 L T

Gli intervalli 18-19, 20-21, e così via, si dicono .

IMITI ABULATI

In genere si usano intervalli di uguale ampiezza (3, 5, 10) e mutuamente esclusivi. L’ampiezza (a)

si calcola aggiungendo 1 alla differenza tra limite superiore e inferiore:

= − + = − + =

a (lim lim ) 1 (

19 18

) 1 2

s i

Tuttavia, i limiti veri o limiti reali si ottengono aggiungendo 0.5 al limite tabulato superiore e

sottraendo 0.5 al limite tabulato inferiore , per dare il senso della continuità.

3

Limiti tabulati Limiti reali Ampiezza (a)

18 - 20 17.5 ┤20.5 3

21 - 23 20.5 ┤23.5 3

24 - 26 23.5 ┤26.5 3

In questo caso, la prima classe comprende i punteggi fino a 20.50 (X ≤ 20,50), mentre la classe

successiva comprende i punteggi maggiori di 20.50, ossia da 20.51 in su (X > 20,50).

Per ogni intervallo occorre calcolare un valore che rappresenta l’intervallo stesso, cioè il punto

centrale (X ), che per convenzione rappresenta la classe. In caso di classi di ampiezza unitaria, X

c c

corrisponde esattamente al valore X (se X è 19, X è 19). Altrimenti, basta calcolare la semisomma

c

dei limiti superiore e inferiore: ad esempio, per l’intervallo 18-19, il valore di X è pari a 18,5.

c

CLASSI Limiti Reali X F X F

c c

18-19 17.5 ┤19.5 18.5 6 111

20-21 19.5 ┤21.5 20.5 10 205

22-23 21.5 ┤23.5 22.5 9 202.5

24-25 23.5 ┤25.5 24.5 5 122.5

30 641

1.5 - RAPPRESENTAZIONI GRAFICHE

Le distribuzioni di frequenza possono essere rappresentate graficamente in vari modi:

• G B : rappresenta distribuzioni di frequenza di variabili classificate in

RAFICO A ARRE

categorie (scala nominale, scala ordinale, variabili discrete). È formato da una serie di rettangoli

(barre), con una base di ampiezza uguale in ascissa, che rappresenta le varie categorie, e una

diversa altezza in ordinata, che corrisponde alla frequenza relativa a ciascuna categoria.

• G T : ogni spicchio della torta rappresenta la frequenza (di solito percentuale) di

RAFICO A ORTA

una categoria. L’angolo si calcola in base alla formula: ⋅

F % 360

=

ANGOLO 100

• I : analogo al grafico a barre, ma le barre sono adiacenti. Rappresenta distribuzioni

STOGRAMMA

di frequenza per dati misurati su scala a intervalli o a rapporti equivalenti (variabili continue).

La base (b) corrisponde al segmento delimitato dai limiti reali della classe: è l’ampiezza della

classe. L’altezza (h) è il rapporto tra area e base, dove l’area è la frequenza (F) della classe:

Area FREQUENZA

= =

ALTEZZA Base AMPIEZZA

• P F : rappresenta dati misurati su scala a intervalli o a rapporti

OLIGONO DI REQUENZA

equivalenti (variabili continue). Sull’asse delle ascisse viene riportato X , mentre sull’asse delle

c

ordinate viene riportata la frequenza (F). Se le classi hanno ampiezza uguale, si possono

riportare direttamente le frequenze, mentre se hanno ampiezza diversa, si calcola:

FREQUENZA

=

ALTEZZA AMPIEZZA

• O F C : sull’asse delle ascisse si riporta il valore centrale della classe

GIVA REQUENZE UMULATE

(X ), e sull’asse delle ordinate la frequenza cumulata (o cumulata percentuale)

c

1.6 - TABELLE A DOPPIA ENTRATA

Sono utili nello studio congiunto di 2 variabili misurate su scala nominale (mutabili) o ricondotte a

tale misura (scale raggruppate in intervalli). Lo scopo è analizzare come si distribuiscono le

frequenze nelle diverse categorie di una variabile secondo le diverse categorie dell’altra.

4

T D E

Nella costruzione di , le righe sono tante quante sono le classi della

ABELLE A OPPIA NTRATA

prima variabile, mentre le colonne sono tante quante le classi della seconda variabile.

I totali per riga e per colonna sono detti frequenze marginali per riga e frequenze marginali per

colonna. All’incrocio tra ciascuna categoria per riga con ciascuna categoria per colonna, si

trovano le frequenze di occorrenza simultanea delle categorie stesse, le frequenze interne.

A B C Totale

Casalinghe 40 25 20 85

Lavoratrici 10 15 30 55

Totale 50 40 50 140

A partire da una tabella a doppia entrata, è possibile calcolare:

• Frequenze percentuali per riga : le basi sono 85, 55 e 140. In questo caso sono sommabili

solo i valori per riga, ed i totali per riga devono risultare uguali a 100. La percentuale per riga

⋅ ⋅

20 100 50 100

= =

di“Casalinghe C” è pari a . Invece, il “marginale A” è pari a

F % F %

85 140

• Frequenze percentuali per colonna : le basi sono 50, 40, 50 e 140. Sono sommabili solo i

valori per colonna, ed i totali per colonna devono essere uguali a 100. La percentuale per

⋅ ⋅

15 100 85 100

= =

colonna di “Lavoratrici B” è pari a . Il “marginale Casalinghe” è

F % F %

40 140

• Frequenze percentuali sul totale : la base è sempre 140. Sono sommabili tutti i valori, per riga

e per colonna, ed il totale generale deve risultare uguale a 100. La percentuale sul totale di

⋅ ⋅

25 100 85 100

= =

“Casalinghe B” è pari a . Il “marginale Casalinghe” è pari a

F % F %

140 140

2. LE DISTRIBUZIONI

I parametri che sintetizzano un insieme di dati grezzi sono la tendenza centrale e la dispersione.

2.1 - INDICATORI DI TENDENZA CENTRALE

M

La è utilizzata in caso di dati qualitativi su scala nominale, ma è un indicatore ambiguo e

ODA

poco usato (se le frequenze sono tutte uguali non è possibile trovare la moda). In pratica, è il valore

di X con la frequenza più elevata in una distribuzione: il valore più comune in un insieme di valori.

L’indicatore di tendenza centrale più adeguato in caso di misure su scala a intervalli o a rapporti

M A

equivalenti è la . In caso di dati non raggruppati, si ottiene sommando tutti i

EDIA RITMETICA

valori di X e dividendo per il numero N di osservazioni :

∑ X

=

X N

In caso si parta da distribuzioni di frequenza, si adotta un’altra formula della media aritmetica:

∑ ⋅

X F

=

X N

Infine, in caso di dati raggruppati in classi, si adotta la seguente formula:

∑ ⋅

X F

c

=

X N

CLASSI F X X F

c c

18-20 15 19 285

21-22 18 21.5 387

23-24 20 23.5 470

25-26 16 25.5 408

27-30 13 28.5 370.5

82 (N) 1920.5 (Σ X F)

c

5

Alcune proprietà della media aritmetica possono essere così riassunte:

a) La somma di tutti gli scarti è pari a 0

→ − =

= − ( X X ) 0

SCARTO ( X X ) i

b) La somma degli scarti al quadrato è pari al minimo

∑ − =

2

( X X ) min

i M P

Un’ulteriore variante è rappresentata dalla . In caso avessimo calcolato la media

EDIA ONDERATA

dei punteggi X separatamente su 2 gruppi costituiti da un diverso numero N di soggetti:

Femmine →

- = =

N 10 ; X 25

f

Maschi →

- = =

N 20 ; X m 3 0

In questo caso, per calcolare la media generale dei 30 soggetti si deve moltiplicare ciascuna delle

due medie per il suo “peso” (la prima è stata calcolata su 10 soggetti, la seconda su 20), sommare

questi due valori e dividerli per il totale dei soggetti (30):

⋅ + ⋅

25 10 30 20 850

= = =

X 28

.

33

30 30 M

Considerando una distribuzione di valori X ordinata in senso crescente, la è quel valore

EDIANA

che divide la distribuzione in due parti uguali. In caso di dati non raggruppati, basta ordinare in

senso crescente i valori di X e calcolare la posizione che si trova a metà della distribuzione.

+

n 1

=

POS Me 2

In caso di N = 15 soggetti, il valore di X corrispondente all’8° posizione è la mediana. In caso di N =

16 soggetti, il valore di X corrispondente alla mediana si trova in posizione 8,5: perciò, il suo valore è

dato dalla media dei valori di X in posizione 8 e 9.

In caso di distribuzioni di frequenza, si calcola la POS Me allo stesso modo. In seguito, si cerca nella

colonna delle F , il valore che “contiene” POS Me, cioè la prima frequenza cumulata maggiore

cum

di POS Me . Infine, si vede a quale valore di X corrisponde la F individuata.

cum

In caso di dati raggruppati in classi, si calcola la POS Me, ma con N > 50 si pone N al numeratore

invece di N+1. Si cerca nella colonna delle F quella che contiene POS Me, si individua la classe

cum

corrispondente e si applica la seguente formula: −

n Pos F cum

ll

= = + ⋅

POS Me Mediana X (

i )

ll

2 F

i

Dove:

- X è il limite reale inferiore della classe che contiene la mediana

ll

- F cum è la frequenza cumulata della classe precedente a quella che contiene la mediana

ll

- (i) è l’ampiezza della classe che contiene la mediana

- F è la frequenza della classe che contiene la mediana

i

Ponendo come esempio delle classi di ampiezza unitaria:

X F F cum

0 2 2

1 1 3

2 2 5

3 4 9

4 3 12

5 7 19

6 11 30

30

+

30 1

= =

POS Me 15 . 5

2

= −

Limiti Re ali 4

. 5 5 . 5 6

15

.

5 12

= + ⋅ = + =

Mediana 4 .

5 (

1

) 4

. 5 0 .

5 5

7

A differenza della media, la mediana non è influenzata dai valori estremi.

2.2 - QUARTILI, DECILI E PERCENTILI

Q

I sono 3 valori che dividono la distribuzione in quattro parti, ciascuna delle quali

UARTILI

contiene il 25% dei soggetti N:

• Q → Primo quartile : valore al di sotto del quale si trova il 25% dei soggetti (X ≤ Q )

1 1

+

N 1

= ⋅

PosQ 1

1 4

• Q → Secondo quartile : valore al di sotto del quale si trova il 50% dei soggetti (X ≤ Q )

2 2

+

N 1

= ⋅

PosQ 2

2 4

• Q → Terzo quartile : valore al di sotto del quale si trova il 75% dei soggetti (X ≤ Q )

3 3

+

N 1

= ⋅

PosQ 3

3 4

In caso di distribuzioni di frequenza, la procedura è simile a quella per il calcolo della mediana:

CLASSI F amp F N

= ⋅ =

cum PosQ 1 20

.

5

1

18-20 15 3 15 4

21-22 18 2 33

23-24 20 2 53

25-26 16 2 69

27-30 13 4 82

82 −

PosQ F cum

1 ll

= + ⋅

Q X ( amp )

1 ll F i

20 .

5 15

= + ⋅ =

Q 20

.

5 2 21

.

12

1 18

D

I sono 9 valori che dividono la distribuzione in 10 parti, ciascuna delle quali contiene il 10%

ECILI

dei soggetti N. Considerando le distribuzioni di frequenza, la procedura è simile alla mediana:

N

N

= ⋅ = ⋅

PosD 1 PosD 2

1 2

10 10

N

= ⋅

PosD 7

7 10

CLASSI F amp F cum

18-20 15 3 15

21-22 18 2 33

23-24 20 2 53

25-26 16 2 69

27-30 13 4 82

82

82

= ⋅ =

PosD 8 65 . 6

8 10 −

65

. 6 53

= + ⋅ =

D 8 24 . 5 2 26

. 08

16 7

P

I sono 99 valori che dividono la distribuzione in 100 parti , ciascuna delle quali contiene

ERCENTILI

l’1% dei soggetti N. Considerando le distribuzioni di frequenza:

N N

N

= ⋅ = ⋅ = ⋅

PosP 1 PosP 3 5 PosP 8

8

1 35 88

100 100 100

82 10 . 66 0

= ⋅ = = + ⋅ =

PosP 13 10

. 66 P 17 . 5 3 19 . 63

13 13

100 15

R P

Il , indicato come RP(X), è una forma di standardizzazione, e corrisponde alla

ANGO ERCENTILE

percentuale di soggetti che assumono valore ≤ X. Dato un insieme di punteggi X disposti in

ordine crescente, si considera un punteggio X e si individua la percentuale di casi che hanno

punteggio ≤ X. Quindi, al contrario dei percentili, si parte da X e si arriva alla percentuale:

Pos 100

=

RP ( X ) N

In caso di dati grezzi, si ordinano in ordine crescente e si individua la posizione occupata da X (6).

Su un insieme di N = 10, RP(X) in posizione 6 è 60: ciò significa che il 60% dei punteggi è ≤ X.

In caso di dati raggruppati in classi, occorre calcolare la posizione occupata da X = 25.5:

CLASSI F F cum

18-20 15 15

21-22 18 33

23-24 20 53

25-26 16 69

27-30 13 82

82 ⋅ ⋅

Pos 100 Pos 100

= =

RP ( 25 .

5

) N 82

X X

ll

= + ⋅

Pos F cum F

ll i

i

- Si individua l’intervallo in cui cade X (25.5 cade nell’intervallo 25-26)

- F cum è la frequenza cumulata della classe precedente a quella che contiene X

ll

- X è il limite reale inferiore della classe che contiene X

ll

- i è l’ampiezza della classe che contiene X

- F è la frequenza della classe che contiene X

i − ⋅

25

.

5 24 . 5 61 100

= + ⋅ = = =

Pos 53 16 61 RP ( 25

. 5

) 74

. 39

2 82

Il punteggio 25.5 trasformato in rango percentile è dunque, approssimato, 74.

X = 25.5 è il 74° percentile. Ciò significa che il 74% dei soggetti ha un punteggio X ≤ 25.5.

2.3 - MISURE DI DISPERSIONE

D

La è la somma degli scarti al quadrato:

EVIANZA ∑ − 2

( X X ) V

La devianza si divide per N, ottenendo la media degli scarti al quadrato, ossia la :

ARIANZA

∑ − 2

( X X )

=

2

s N

La varianza non può mai essere negativa!

D S

La , o scarto quadratico medio, è la radice quadrata della varianza:

EVIAZIONE TANDARD ∑ − 2

( X X )

= =

2

s s N

Partendo dai dati grezzi: 8

X =

− 2

− X 110

( X X )

( X X )

70 -40 1600

120 10 100

90 -20 400

140 30 900

130 20 400

3400

3400

= =

2

s 680 = =

s 680 26 .

07

5

∑ − 2

( X X )

Partendo da distribuzioni di frequenza, ogni scarto al quadrato viene moltiplicato per la

frequenza relativa al valore X: ∑ − ⋅

2

( X X ) F

i

=

2

s N

F X F 47

X − − − ⋅

2 2

( X X ) ( X X ) ( X X ) F = =

i X 6

.

7

7

6 3 18 -0.7 0.49 1.47 3

.

43

7 3 21 0.3 0.09 0.27 = =

2

s 0

.

49

7

8 1 8 1.3 1.69 1.69

7 47 3.43

= =

s 0 . 49 0 . 7

∑ − ⋅

2

( X X ) F

i

Partendo da distribuzioni raggruppate in classi, al posto di X si usa X della classe:

c

F X

CLASSI − − − ⋅

2 2

( X X ) ( X X ) ( X X ) F

c

c c c i

18-20 15 19 -4.42 19.54 293.00

21-22 18 21.5 -1.92 3.69 66.35

23-24 20 23.5 0.08 0.006 0.13

25-26 16 25.5 2.08 4.33 69.22

27-30 13 28.5 5.08 25.81 335.48

82 764.18

Dove:

=

X 23

. 42

∑ − ⋅

2

( X X ) F 764 . 18

c i

= = = = =

2

s 9 . 32 s 9 . 32 3 . 05

N 82

Le corrispondono alle seguenti:

FORMULE ABBREVIATE DI VARIANZA E DEVIAZIONE STANDARD

∑ ∑

⋅ ⋅

2 2

X F X F

= − = −

2 2 2

s X s X

N N

F X X 2 X F

2

CLASSI c

c ⋅

c

18-20 15 19 361 5415

21-22 18 21.5 462.25 8320.5

23-24 20 23.5 552.25 11045

25-26 16 25.5 650.25 10404

27-30 13 28.5 812.25 10559.25

82 45743.75 9

45743 .

75

= − =

2 2

s ( 23 . 42 ) 9 . 34

82

= =

s 9

. 34 3 .

05

2.4 - MISURE SU SCALE NOMINALI E ORDINALI

S N

In caso di , la misura di tendenza centrale è solamente la moda: la categoria con

CALE OMINALI

frequenza più elevata. La variabilità è rappresentata dal numero di categorie differenti.

S O

In caso di , le misure di tendenza centrale possono essere la moda e la mediana.

CALE RDINALI = −

La variabilità è rappresentata dalla differenza interquartilica, , dove:

DI Q Q

3 1

1 3

= =

POS Q N POS Q N

1 3

4 4

2.5 - DISTRIBUZIONI ASIMMETRICHE

Se una distribuzione è simmetrica e unimodale, media, mediana e moda hanno circa lo stesso

valore. Tuttavia, essendo la media influenzata dai valori estremi, una distribuzione sbilanciata si

definisce asimmetrica: maggiore è la variabilità dei punteggi, maggiore è l’asimmetria.

L’ tiene conto di media, mediana e deviazione standard:

ASIMMETRIA ⋅ −

3 ( X mediana )

=

AS s

• Valore 0 → distribuzione perfettamente simmetrica

• Valore negativo → le frequenze più elevate si trovano in corrispondenza dei punteggi più alti

(media < mediana < moda)

• Valore positivo → le frequenze più elevate si trovano in corrispondenza dei valori più bassi

(moda < mediana < media)

2.6 - CAMPO E COEFFICIENTE DI VARIAZIONE

Il campo di variazione è la semplice differenza tra valore massimo e minimo nella distribuzione.

Il è invece un indice di variabilità relativa:

COEFFICIENTE DI VARIAZIONE s

= ⋅

CV 100

X

2.7 - CURTOSI

C

La indica quanto una distribuzione è “piatta” (platicurtica) o “appuntita” (leptocurtica),

URTOSI

ovvero quanto si allontana dalla classica forma “a campana”, o mesocurtica (curtosi = 0).

La curtosi dipende dalla deviazione standard (s): 10

• D L

Se s è piccolo , il valore dell’indice è negativo → (i punteggi X

ISTRIBUZIONE EPTOCURTICA

sono raggruppati intorno alla media)

• D P

Se s è grande , il valore dell’indice è positivo → (molti punteggi

ISTRIBUZIONE LATICURTICA

distanti dalla media)

2.8 - STANDARDIZZAZIONE DELLE MISURE

S significa riferire la misura stessa ad una scala standard: la scala

TANDARDIZZARE UNA MISURA

standard più usata è detta “z” ed ha media = 0, varianza = 1 e deviazione standard = 1.

Per passare dalla scala originaria a quella standardizzata, si trasformano tutti gli X in punti z:

X X

i

=

Z i s

Z esprime la distanza dalla media: se il soggetto ha un punteggio X = 18, che standardizzato diviene

z = -1.44, sappiamo che si trova al di sotto della media. Quindi, la standardizzazione è necessaria

per avere un’idea della posizione che un soggetto occupa in un gruppo, e per confrontare due

prestazioni dello stesso soggetto. Inoltre, si può affrontare il problema inverso: conoscendo il

punteggio standardizzato z di un soggetto, trovare il punteggio X corrispondente:

= + ⋅

X X Z s

i i

S = +

Esistono però altre di standardizzazione, la cui formula generica è , dove a e b

Y a b x z

CALE

sono costanti e rappresentano la media e la deviazione standard della nuova scala:

S T

⇒ : ha media = 50 e deviazione standard = 10 e può assumere valori positivi da 10 a

CALA

90: −

X X

= + ⋅ = + ⋅

T 50 10 z T 50 10 s

S S

⇒ (standard ten) : ha media = 5.5 e deviazione standard = 2. Consente di ottenere 10

CALA TEN

categorie standardizzate di punteggi con −

X X

= + ⋅ = + ⋅

Sten 5

.

5 2 z Sten 5

. 5 2 s

S S

⇒ (standard nine) : ha media = 5 e deviazione standard = 2. Consente di ottenere

CALA TANINE

9 categorie standardizzate di punteggi con −

X X

= + ⋅ = + ⋅

Stanine 5 2 z Stanine 5 2 s

2.9 - LA DISTRIBUZIONE NORMALE

C G

La curva normale, o , è una distribuzione teorica di frequenza dei punteggi di

URVA DI AUSS

una popolazione, riguarda solamente le variabili continue e gode di diverse proprietà:

- Sull’ascisse si trovano tutti i valori di X

- Sull’ordinata si trovano le frequenze F di ciascun valore

- È simmetrica (media, mediana e moda coincidono), continua, unimodale e mesocurtica

- L’area sottesa dall’intera curva è pari a 1

- È asintotica sulle ascisse (si avvicina sempre più all’asse delle ascisse senza mai raggiungerlo)

Conoscendo media e deviazione standard è possibile determinare l’area compresa nell’intervallo

tra due valori di X. Per gli usi pratici della distribuzione normale, tuttavia, si ricorre alla trasformazione

D N S

in , con media = 0 e deviazione standard = 1:

ISTRIBUZIONE ORMALE TANDARDIZZATA −

X X

=

z s

Vi è una tabella che contiene tutti i valori delle aree per ogni valore di z, e riporta l’area compresa

tra z = 0 e qualunque valore di z per la metà positiva (data la simmetria, per trovare i valori negativi

basta trovare il corrispettivo valore positivo). La prima colonna riporta i valori di z fino alla prima

11

cifra decimale, mentre le colonne successive sono intestate con il valore della seconda cifra

decimale di z. Dall’incrocio fra riga e colonna si ricava l’area compresa tra 0 e il valore di z.

Ponendo come esempio una distribuzione con = 50 e s = 10, per trovare la PROPORZIONE DI CASI

X

’ X = 30 X = 65 , si procede come segue:

CON PUNTEGGIO NELL INTERVALLO COMPRESO TRA E

− − − −

X X 30 50 X X 65 50

Si applicano le formule e

= = = − = = =

a) z 2 z 1

. 50

30 65

s 10 s 10

b) Si trovano sulla tabella le aree corrispondenti a z = -2 (0.4772) e z = 1.5 (0.4332)

c) L’area compresa tra z = -2 e z = 1.5 sarà dunque data dalla somma delle due aree

+ =

0 . 4772 0 . 4332 0 . 9104

d) Il risultato, in percentuale, diviene 91.04%

e) Conoscendo il campione di riferimento N = 3500 soggetti, è possibile trovare quanti soggetti

hanno un punteggio compreso tra 30 e 65

= ⋅ = ⋅ = ≈

n N 0

.

9104 3500 0

.

9104 3186 .

4 3186 soggetti

Se invece si hanno due punteggi z entrambi positivi (o entrambi negativi), occorre trovare l’area

maggiore e sottrarre a questa l’area minore.

Considerando un campione di N = 3500 soggetti, con = 52 e s = 12, se occorre trovare il

X

X “ ” 10% occorre procedere:

PUNTEGGIO CHE DELIMITA LA CODA DEL DEI SOGGETTI MIGLIORI

a) Se nella coda è sottesa un’area pari a 0.1000, sottraendo questo valore dall’area della “metà

curva” (0.5000), si otterrà l’area compresa fra z = 0 e il valore incognito z che la delimita

− =

Si cerca sulle tavole la proporzione che più si avvicina a

b) 0

.

5000 0 .

1000 0

.

4000

c) Trovato il valore z corrispondente (0.3997 → z = 1.28), si usa la formula inversa per trovare X:

= + ⋅ = + ⋅ =

X X z s 52 1 . 28 12 67

.

36

d) Quindi, il punteggio limite per rientrare tra i migliori 35 (10% di N) è X = 67.36

X Q

Infine, se si volesse :

TROVARE IL VALORE DI CHE CORRISPONDE AL 1

a) Si cerca sulle tavole la proporzione che più si avvicina a 0.2500 (il primo quartile delimita

un’area nella prima metà della curva, con 0.2500 al di sotto e 0.7500 al di sopra)

b) Trovato il valore z corrispondente (0.2486 → z = 0.67), si cambia di segno perché siamo nella

metà inferiore della curva, e si applica la formula inversa per trovare X:

= + ⋅ = + − ⋅ =

X X z s 52 ( 0 .

67 ) 12 43 .

96

3. RELAZIONI TRA VARIABILI

C

La è la tendenza che due variabili X e Y, misurate sugli stessi soggetti, hanno a

OVARIANZA

“variare insieme”. Si possono studiare sia:

• Tipo di relazione : la forma della relazione (lineare, curvilinea)

12

• Intensità della relazione : la forza del legame tra X e Y (nulla, concordanza, discordanza)

• Direzione della relazione : se la relazione è positiva, i valori di X e Y crescono

concordemente, se è negativa, al crescere di una variabile corrisponde il diminuire dell’altra

3.1 - TIPO DI RELAZIONE (FORMA)

Per avere un’idea della tra X e Y, si rappresenta la posizione degli N

FORMA DELLA RELAZIONE

soggetti nel diagramma di dispersione. Sulle ascisse si riportano i valori di X, sulle ordinate i valori

di Y, segnando un punto per ogni soggetto all’incrocio tra il suo punteggio X e il suo punteggio

Y.

Come detto, le relazioni possono avere direzione positiva o negativa:

Oppure, le due variabili possono essere indipendenti l’una dall’altra:

3.2 - INTENSITÀ E DIREZIONE DELLA RELAZIONE

Per misurare l' lineare tra X e Y, quando le due variabili sono misurate su

INTENSITÀ DEL LEGAME

scale a intervalli o rapporti equivalenti, si utilizza un indice che esprime sia l'intensità che la

P

direzione della relazione, detto coefficiente di correlazione lineare o :

COEFFICIENTE R DI EARSON

n

∑ ⋅

Z Z

x y

=

r 1 n

Z e Z sono i punteggi standardizzati delle variabili X e Y:

x y − −

X X Y Y

= =

Z Z

x Y

S S

x Y

Il coefficiente r di Pearson varia tra -1.00 e +1.00, ed ha i seguenti significati:

a) r = +1.00 → massima concordanza positiva (all’aumentare di X, Y aumenta in modo costante)

b) r positivo → le variazioni di X e Y covariano nella stessa direzione (concordanza)

c) r = 0.00 → assenza di relazione (le variabili sono indipendenti)

d) r negativo → le variazioni di X e Y covariano nella direzione inversa (discordanza)

e) r = -1.00 → massima correlazione negativa (all’aumentare di X, Y diminuisce in modo costante)

Per “semplicità”, la stesa formula può essere trasformata in: 2

Tale coefficiente elevato al quadrato, il (r ), esprime la

COEFFICIENTE DI DETERMINAZIONE

proporzione di varianza comune alle due variabili , è sempre positivo e compreso tra 0.00 e

+1.00.

3.3 - COEFFICIENTE DI CORRELAZIONE TRA RANGHI

C

Se le due variabili sono su scala ordinale, si calcola il (rho) di Spearman:

OEFFICIENTE R

S

13


ACQUISTATO

44 volte

PAGINE

28

PESO

1.34 MB

AUTORE

davril86

PUBBLICATO

+1 anno fa


DESCRIZIONE APPUNTO

Riassunto per l'esame di Psicometria della prof. Areni (facoltà di Psicologia), basato su appunti personali e studio autonomo del testo consigliato dal docente "Elementi di statistica per la psicologia", Ercolani-Areni-Leone.
Gli argomenti trattati sono i seguenti:
- La quantificazione in psicologia
- Attendibilità e validità
- Variabili e mutabili
- Scale di misura
- Rappresentazioni grafiche e tabelle a doppia entrata
- Indicatori di tendenza centrale
- Misure di dispersione
- Standardizzazione delle misure
- Distribuzioni
- Relazioni tra variabili (coefficienti di correlazione)
- Regressione
- Probabilità
- Verifica delle ipotesi (caso di un campione, caso di due campioni indipendenti, caso di due campioni correlati, ipotesi su differenza tra medie, ipotesi sulla correlazione, ipotesi sulla forma, ipotesi sulla distribuzione)
- Distribuzione campionaria della media
- Distribuzione t di Student


DETTAGLI
Esame: Psicometria
Corso di laurea: Corso di laurea in psicologia e processi sociali
SSD:
A.A.: 2015-2016

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher davril86 di informazioni apprese con la frequenza delle lezioni di Psicometria e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università La Sapienza - Uniroma1 o del prof Areni Alessandra.

Acquista con carta o conto PayPal

Scarica il file tutte le volte che vuoi

Paga con un conto PayPal per usufruire della garanzia Soddisfatto o rimborsato

Recensioni
Ti è piaciuto questo appunto? Valutalo!

Altri appunti di Psicometria

Psicometria: Le distribuzioni di frequenza e Tendenza centrale e dispersione
Appunto
Psicometria: Le scale di misura
Appunto
Psicometria: Analisi della varianza (ANOVA)
Appunto
Esercizi distribuzioni di frequenza con soluzioni
Esercitazione