Che materia stai cercando?

Psicometria: Le distribuzioni di frequenza e Tendenza centrale e dispersione

Le distribuzioni di frequenza e Tendenza centrale e dispersione
Cosa è una frequenza, Cosa è una distribuzione, Le tabelle di frequenza per variabili quantitative, Le rappresentazioni grafiche per variabili quantitative, L’istogramma, Il poligono di frequenza, Le tabelle di frequenza per variabili qualitative,Indici di tendenza centrale, moda, mediana, media, Quartili, Decili,... Vedi di più

Esame di Psicometria docente Prof. M. Vecchione

Anteprima

ESTRATTO DOCUMENTO

- Il nono decile (D10), è il valore al di sotto del quale cade il 90% casi

Percentili: sono 99 valori che dividono la distribuzione in cento parti uguali:

- Il primo percentile (C1) è il valore al di sotto del quale cade l’1% dei casi

- Il secondo percentile (C2) è il valore al di sotto del quale cade il 2% dei casi

- [...]

- Il 50-esimo percentile (C50), è il valore al di sotto del quale cade il 50% casi (corrisp a mediana)

- Il 99-esimo percentile (C99), è il valore al di sotto del quale cade il 99% casi

Calcolo di decili e percentili

Per calcolare decili e percentili si usa la medesima procedura utilizzata per il calcolo dei quartili:

L’unica differenza riguarda la formula per individuare la posizione (POS):

- Per i decili: (n+1)/10 si moltiplica per il decile che si vuole individuare

- Per i percentili: (n+1)/100 si moltiplica per il percentile che si vuole individuare

Media

Volendo riassumere in un solo numero un insieme di dati, possiamo calcolarne il valore medio (es.

Media dei voti di uno studente)

La media aritmetica è la più nota misura di tendenza centrale. È definita da:

x = x + x + x + x /n

1 2 3 n

La media è la somma dei valori di tutte le osservazioni diviso il numero delle osservazioni

Può essere espressa anche come

n

x = Σ x / n => La somma di tutte le x, dalla prima (1) all’ultima (n-esima) diviso n

i i

l

Mentre il simbolo x viene utilizzato per indicare la media calcolata su un campione, il simbolo μ

viene utilizzato per indicare la media di una popolazione

Una formula alternativa (Media aritmetica ponderata)

Quando si lavora direttamente sulle tabelle di frequenza, una formula alternativa per il calcolo

della media è la seguente.

k

x = Σ x f / n => si sommano i k valori della variabile moltipl per la rispettiva frequenza diviso n

i i i

l

x = (2x1) + (3x2) + (4x5) + (5x8) + (6x10) + (7x5) + (8x3) + (9x1) / 35 = 5.6

Moda, media e mediana

- Tra gli indici di tendenza centrale, la moda è l’indice meno informativo. Essa infatti viene

calcolata sulle frequenze di un solo valore e prescinde dalla natura numerica delle osservazioni

- In alcune distribuzioni, inoltre, la moda può mancare o si possono presentare due o più mode

(distribuzioni plurimodali):

- Distribuzione zeromodale (o rettangolare): nessun valore ha una frequenza più elevata degli altri

- Distribuzione bimodale: ci sono due valori con una frequenza più elevata degli altri

- La mediana è più informativa della moda: anch’essa si basa sulle frequenze ma considera anche

l’ordine tra le osservazioni

- In genere la media è l’indice di tendenza centrale più informativo, in quanto considera i valori

numerici di tutte le osservazioni

Tendenza centrale e dispersione

- Non sempre, però, la media è l’indice più adatto ad individuare il valore più rappresentativo di una

distribuzione

- Un limite della media è la sua sensibilità ai valori estremi, o mancanza di “robustezza” (soprattutto

quando la distribuzione è formata da poche unità)

Confronto tra Media e Mediana

- La media è sensibile all’eventuale presenza di valori anomali (outliers), ossia da quei valori che si

discostano sensibilmente dagli altri valori della distribuzione

- La mediana è più stabile (o robusta), poiché in genere non viene influenzata dai valori estremi

Esempio

Consideriamo i valori di peso (Kg) persi da un campione di 7 soggetti che sono stati sottoposti ad

una dieta: 2.9 3.3 3.7 3.8 4.3 4.9 5.4

X = 4.0 Me = 3.8

Modifichiamo la distribuzione Immaginiamo che l’ultimo soggetto ha perso in realtà 13.8 Kg

invece di 5.4 (come in precedenza): 2.9 3.3 3.7 3.8 4.3 4.9 13.8

X = 5.2 Me = 3.8

La mediana rimane invariata, mentre la media diviene pari a 5.2

In questo caso la media non è più un valore particolarmente rappresentativo della distribuzione,

poiché solo un soggetto su sette ha perso più di 5 Kg

Indici di dispersione

- La dispersione è la seconda importante proprietà che descrive una distribuzione

- Gli indici di tendenza centrale ci dicono dove sono concentrati i valori della variabile, ovvero

quali sono i valori più rappresentativi della distribuzione

- Gli indici di dispersione ci dicono quanto i valori si disperdono intorno alle misure di tendenza

centrale, ovvero quanto si disperdono intorno al valore più rappresentativo della distribuzione

- Come per gli indici di tendenza centrale, esistono diversi indici di dispersione. La scelta

dell’indice più adeguato dipende dal livello di misura della variabile

Forma allungata grafico istogramma => bassa variabilità (0 variab, una sola colonna)

Forma schiacciata grafico istogramma => alta variabilità (massima variab, colonne alte uguali)

Campione A Campione B

Punteggio f Punteggio f

16 0 16 2

17 1 17 3

18 2 18 4

19 3 19 5

20 10 20 5

21 11 21 6

22 8 22 5

23 7 23 4

24 1 24 4

25 0 25 3

26 0 26 2

Media 21 Media 21

Gli indici di tendenza centrale consentono di descrivere sinteticamente un fenomeno, ma non

forniscono alcuna informazione sul modo in cui i dati si distribuiscono attorno al valore centrale

Scale a intervalli e rapporti equivalenti

Se la variabile è misurata su scala a intervalli o a rapporti equivalenti si possono utilizzare diversi

indici di dispersione:

L’intervallo di variazione + Lo scarto semplice medio + La varianza + La deviazione standard

(o scarto quadratico medio) + Il campo di variazione

Intervallo di variazione

L’intervallo di variazione (o range) è la differenza tra il valore massimo e il valore minimo presenti

nella distribuzione: Il campo di variazione misura quindi l’ampiezza dell’intervallo dei dati:

- Più il range è piccolo, più i valori sono concentrati attorno ai valori centrali

- Più il range è grande, più i dati sono dispersi attorno ai valori centrali

Vantaggi:

- È facile da calcolare

Limiti:

- Tiene conto di soli due valori della distribuzione, trascurando tutti gli altri

- È fortemente influenzato dai valori estremi

- Tende ad aumentare con l’aumentare del numero di osservazioni

È utile disporre di un indice di dispersione che consideri tutti i valori della distribuzione (e non

solo quelli estremi)

Un indice efficace di dispersione dovrebbe riflettere il grado in cui ciascun valore si discosta dalla

tendenza centrale della distribuzione

Quanto in media, i valori si discostano dall media?

Un modo per calcolare la variabilità dei dati tenendo conto di tutti i valori potrebbe consistere nel:

1. Calcolare la distanza (o scarto) di ciascun valore dalla media

2. Fare la media aritmetica di tali distanze:

n

(x – x) + (x – x) + (x – x) / n = Σ (x – x) /n = 0

1 2 n i

i=1

Per una proprietà della media, tuttavia, la somma degli scarti di tutti i valori dalla loro media è pari

a zero

Scarto semplice medio

Il problema si può risolvere facilmente considerando gli scarti dalla media in valore assoluto

Lo scarto semplice medio (SSM) è la media degli scarti (in valore assoluto) tra tutti i valori della

distribuzione e la loro media n

|x – x| + |x – x| + |x – x| / n = Σ |x – x| /n = SSM

1 2 n i

i=1

SSM = media della distanza di tutti i valori dalla media

Un limite dello SSM è che la somma degli scarti in valore assoluto dalla media può essere uguale

alla somma degli scarti in valore assoluto da un altro valore della distribuzione (diverso dalla

media).

Varianza

Un indice analogo si calcola elevando al quadrato le deviazioni dalla media

Se sommiamo i quadrati delle deviazioni (o “scarti”) dalla media e dividiamo questa somma per il

numero delle osservazioni otteniamo la varianza:

n

2 2 2 2

Varianza = (x – x) + (x – x) + (x – x) / n = Σ (x – x) /n

1 2 n i

i=1

La varianza rappresenta quindi la media dei quadrati degli scarti dalla media

Pesano di più valori più distanti dalla media 

Quando la varianza viene calcolata su una popolazione si indica con il simbolo greco 2

Quando la varianza viene calcolata su un campione si indica con s2

In questo caso il denominatore n è sostituito da n-1 in modo da ottenere una stima corretta della

dispersione della variabile nella popolazione da cui il campione in esame è stato estratto

n

2 2

s = Σ (x – x) /n-1

i

i=1

Questa correzione al denominatore fa sì che la stima della varianza sia un po' più grande,

correggendo così la tendenza della formula a sottostimare la varianza soprattutto nel caso in cui si

lavori con poche osservazioni (n piccolo)

La varianza può assumere solo valori positivi (il numeratore è una somma di valori al quadrato)

Essa varia pertanto da 0 a +∞, dove 0 indica assenza di variabilità (stiamo misurando una costante!)

Per una proprietà della media, la somma degli scarti al quadrato dalla media è minore della somma

degli scarti al quadrato da qualsiasi altro valore (proprietà dei minimi quadrati) [non ha problema

scarto semplice medio]

Il numeratore della varianza è la «devianza» (la somma degli scarti al quadrato dalla media)

Un limite della varianza come misura di dispersione è quella di avere una unità di misura espressa

al quadrato rispetto alla media e all'unità di misura originale

Essa indica la media dei quadrati degli scarti fra i valori osservati e la loro media

Per facilitare l'interpretazione dell'indice, esprimendolo in un’unità di misura più facilmente

comprensibile, si ricorre spesso al calcolo della deviazione standard (radice quadrata della

varianza)

Deviazione standard

La deviazione standard è l’indice di dispersione della distribuzione più largamente utilizzato

È pari alla radice quadrata della varianza 

Quando viene calcolata sulla popolazione si indica con il simbolo greco :

n

 2

= Σ (x – x) /n

√ i

i=1

Quando viene calcolata sul campione, viene indicata con la lettera latina s (o con ds):

n 2

s = Σ (x – x) /n-1

√ i

i=1

La deviazione standard ha la stessa unità di misura dei valori osservati

Essa indica quanto, in media, ciascun valore si discosta dalla media

Può essere interpretata anche come una misura della accuratezza della media come indice di

tendenza centrale: più è elevata, meno la media è efficace nel fornire un valore che sia

rappresentativo dell’intera distribuzione

Per quando rguarda la dispersione non si possono confrontare distribuzioni con unità di misura

diverse o medie molto diverse

Il coefficiente di variazione

Una misura di dispersione che non risente dell’unità di misura è il coefficiente di variazione

Si basa sul rapporto tra deviazione standard e media:

CV = s/x *100

Esprime il grado di dispersione dei punteggi in termini di scostamento percentuale dalla media (è

una misura standardizzata di dispersione; viene chiamato anche deviazione standard relativa)

È utile quando si vuole confrontare la dispersione di distribuzioni i cui punteggi sono espressi in

unità di misura differenti

CV = 25.61 => Si legge come: «in media i punteggi si discostano dalla media di una quantità pari a

circa il 26% della media)

Scale ordinali

Nel caso di scale ordinali si può utilizzare come indicatore di dispersione la differenza

interquartilica, che corrisponde alla distanza tra il primo e il terzo quartile della distribuzione:


ACQUISTATO

1 volte

PAGINE

13

PESO

152.06 KB

PUBBLICATO

9 mesi fa


DESCRIZIONE APPUNTO

Le distribuzioni di frequenza e Tendenza centrale e dispersione
Cosa è una frequenza, Cosa è una distribuzione, Le tabelle di frequenza per variabili quantitative, Le rappresentazioni grafiche per variabili quantitative, L’istogramma, Il poligono di frequenza, Le tabelle di frequenza per variabili qualitative,Indici di tendenza centrale, moda, mediana, media, Quartili, Decili, Percentili, Indici di dispersione, L’intervallo di variazione, Lo scarto semplice medio, La varianza + La deviazione standard (o scarto quadratico medio), Il coefficiente di variazione, differenza interquartilica,


DETTAGLI
Esame: Psicometria
Corso di laurea: Corso di laurea in psicologia e processi sociali
SSD:
A.A.: 2018-2019

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher AliceDP97 di informazioni apprese con la frequenza delle lezioni di Psicometria e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università La Sapienza - Uniroma1 o del prof Vecchione Michele.

Acquista con carta o conto PayPal

Scarica il file tutte le volte che vuoi

Paga con un conto PayPal per usufruire della garanzia Soddisfatto o rimborsato

Recensioni
Ti è piaciuto questo appunto? Valutalo!

Altri appunti di Psicometria

Riassunto esame Psicometria, prof. Areni, libro consigliato "Elementi di statistica per la psicologia", Ercolani, Areni, Leone
Appunto
Psicometria: Le scale di misura
Appunto
Psicometria: Analisi della varianza (ANOVA)
Appunto
Esercizi distribuzioni di frequenza con soluzioni
Esercitazione