Elementi di Statistica

Appunti di Elementi di statistica basati sugli appunti personali del publisher presi nel corso delle lezioni universitarie, dell’università Palermo - Unipa, della Facoltà di …

Esame Elementi di Statistica

Facoltà Lettere e filosofia

Università Università degli Studi di Palermo

Publisher Alessandra R.

A.A. 2014-2015

39 pagine

Appunto

Vota

Scarica

Estratto del documento

D. CARTOGRAMMI, CARTODIAGRAMMI E MAPPE SOCIALI

- I cartogrammi servono per rappresentare mutabili riferite a luoghi, territori, zone

geografiche, ecc. Per costruirlo bisogna utilizzare una carta geografica in cui siano

chiaramente delimitate le diverse zone, regioni, ecc, rispetto alle quali viene analizzata

la frequenza del carattere che stiamo studiando (nati, morti, reddito pro-capite).

[Grafico pag 77 Italia].

- I cartodiagrammi non sono che dei cartogrammi in cui vengono rappresentati 2 o più

caratteri [grafico pag 78 Italia]

- La mappa è un altro modo di rappresentare le mutabili (pag 79)

RAPPRESENTAZIONE GRAFICA DEI CARATTERI QUANTITATIVI

I caratteri quantitativi presentano modalità quantitative, cioè espresse da numeri. Essi

si dividono in discreti e continui. I caratteri quantitativi discreti sono quei caratteri le

cui modalità sono costituite da singoli valori (es.num.figli). Quelli continui sono quei

caratteri le cui modalità possono assumere tutti i possibili valori di un intervallo

(es.statura).

A. RAPPRESENTAZIONE GRAFICA DI UNA VARIABILE STATISTICA DISCRETA

Esempio: “Num.appartamenti di un residence secondo laluminosità delle stanze”

x f

i i

1 8

2 12

3 14

4 22

5 18

6 10

7 6

Diagrammi cartesiani a segmenti

1) Diagramma con punti

0 0 1 2 3 4 5 6 7 8

2) Diagramma a canne d’organo 19

3) Diagramma con spezzata

0 1 2 3 4 5 6 7

B. RAPPRESENTAZIONE GRAFICA DI UNA VARIABILE QUANTITATIVA CONTINUA

Per rappresentare le distribuzioni delle variabili continue, raggruppate per classi, si

può utilizzare:

Istogrammi : sono quelli più importanti, come grafici a colonne sono costituiti da

tanti rettangoli quanti sono le classi in cui sono stati raggruppati i dati del carattere,

ma a differenza dei grafici a colonne in cui i rettangoli sono distanziati, negli

istogrammi i rettangoli sono contigui (attaccati). Le basi dei rettangoli, poste sull’asse

delle ascisse, rappresentano le ampiezze delle classi, mentre le altezze rappresentano le

frequenze delle classi. Però bisogna distinguere due cose:

1) Quando le classi sono di uguale ampiezza, i rettangoli hanno le basi uguali tra loro e

le altezze proporzionali alle frequenze;

xi fi

400|--600 14 60

600|---800 49 50

800|---1000 32 400 |-- 600

1000|--1200 5 600 |-- 800

tot 100 800 |-- 1000

Classi di ampiezza 200 20 1000 |-- 1200

0 1

2) Quando le classi sono di ampiezza diversa, le ampiezze dei rettangoli sono

rappresentate dalla “densità di frequenza”, cioè la frequenza divisa per l’ampiezza della

classe, quindi i rettangoli hanno come base l’ampiezza delle classi e come altezza la

densità di frequenza (e non la frequenza). Bisogna dunque calcolare l’ampiezza della

classe ( i) e la densità di frequenza (hi) che è data dal rapporto tra la frequenza e

l’ampiezza della classe, cioè hi=fi/ i

Nella seguente tabella è riportata la distribuzione degli operai in una data azienda

secondo l’età: ω ω

xi fi hi=fi/ Esempio:

i i 60/4=15

14|-- 18 60 4 15 116/4=29

18|-- 22 116 4 29

22 30 200 8 25

|--

30|-- 40 230 10 23

40 50 150 10 15

|--

50 150 15 10

|--65

tot 906 20

Poligoni di frequenza: un’altra rappresentazione grafica molto usata per le

distribuzioni di valori continui raggruppati in classi di uguale ampiezza sono i

poligoni di frequenza. Per costruirli si deve:

- rappresentare un piano cartesiano dove, sull’asse delle ascisse, vengono poste le

classi e sull’asse delle ordinate le frequenze;

- individuare, per ciascuna classe, il punto di ascissa pari al valore centrale della

classe stessa e di ordinata pari alla frequenza;

- congiungere i punti così ottenuti con una spezzata;

- chiudere la spezzata congiungendo gli estremi con l’asse delle ascisse nei punti

corrispondenti ai valori centrali della classi immediatamente precedente e successiva a

quelle già considerate, ovvero con le prime due classi di frequenza nulla che si trovano

agli estremi della distribuzione. (50--|100 e 250--|300 sono

xi fi valore centrale della classe classi che non appartengono

50--|100 7 75 alla distribuzione ma servono

100--|150 200 125 per chiudere la spezzata)

150--|200 350 175 (75 e 275 sono i valori centrali

200--|250 300 225 delle classi 50--|100 e 250--|

250--|300 275 300)

tot 850 21

6. MISURE DI TENDENZA CENTRALE (GLI INDICI DI SINTESI)

- Sintesi di una distribuzione

Per evidenziare le caratteristiche fondamentali di un fenomeno statistico è necessario

procedere ad un’ ulteriore sintesi al fine di ottenere delle misure del fenomeno visto nel

suo insieme. L’uso di queste misure ci da una visione globale del fenomeno. Le misure

più significative da calcolare sono:

1. Misure di tendenza centrale: per esprimere qual è il centro della distribuzione e il

valore attorno al quale sono disposti i dati;

2. Misure di variabilità o dispersione: per dire se i dati sono più o meno dispersi

intorno al centro;

3. Misure di forma: per dire se la distribuzione è simmetrica rispetto ad un

determinato valore (se è più o meno appuntita);

4. Misure di concentrazione: per sapere se l’ammontare totale del carattere è equa-

mente distribuito tra tutte le unità statistiche oppure concentrato in poche unità.

- Misure di tendenza centrale

Esse mirano a sintetizzare la posizione del centro sul quale tendono a gravitare gli

elementi della distribuzione e devono fornire una visione d’insieme di tutti gli elementi.

Le misure più comuni sono:

- media aritmetica

- media geometrica I GRUPPO

- media armonica

- media quadratica

- moda II GRUPPO

- mediana

Le misure appartenenti al primo gruppo prendono il nome di medie ferme o algebriche

e tengono conto di tutti i valori della distribuzione.

Le misure appartenenti al secondo gruppo prendono il nome di medie di posizione e si

ottengono scegliendo particolari elementi della distribuzione.

MEDIA ARITMENTICA

E’ la misura di tendenza centrale più usata.

Media aritmetica = ammontare del carattere

Numero dei casi osservati

Si definisce media aritmetica x di un insieme di N (numeri) x1, x2...x :

X= x1+x2+x3+.....xn = ∑xi /N

N

Es: i voti di uno studente sono stati: 6,7,5,6,8,7.

X=6+7+5+6+8+7/6 = 6,5

Nel caso di distribuzioni statistiche:

xi fi X= x1f1+x2f2+x3f3+.....xnfn / f1+f2...fn

x1 fi

x2 f2 ∑ ∑

x3 f3 X= xifi / fi

... ...

xn fn 22

Esempio: calcolare la media aritmetica (variabile quantitativa discreta)

X=2282/25 = 91,28

xi fi xifi

87 1 87

88 2 176 In una distribuzione statistica la media aritmetica si chiama

89 2 178 media aritmetica ponderata perché si moltiplicano le

90 3 270 modalità per le rispettive frequenze.

91 7 637

92 3 276

93 2 186

94 3 282

95 2 190

tot 25 2282

Esempio: calcolare la media aritmetica (variabile quantitativa continua)

Per il calcolo della media aritmetica bisogna trovare i valori centrali e moltiplicarli per

le frequenze. *900 rappresenta il valore

xi fi xc(valore centrale) xcfi centrale tra 800 e 1000

800 --|1000 2 900* 1800

1000--|1200 3 1100 3400

1200--|1400 5 1300 6500

1400--|1600 4 1500 6000

1600--|1800 3 1700 5100

1800--|2000 2 1900 3800

2000--|2200 1 2100 2100

tot 20 28600

∑

X = M = x f = 28600/20= 1430

c i /N

La media si trova sommando tutte le xcfi (moltiplicazione tra valore centrale e

frequenza, in questo esempio si ottiene 28600) e dividendo il risultato per il totale delle

frequenze (28600/20).

Proprietà della media aritmetica

Prima di definire alcune proprietà importanti, è necessario definire lo scarto. Dato il

valore xi e il numero a, la differenza (xi-a) è detta scarto. Esse sono due:

1) la somma degli scarti di un insieme di valori dalla loro media aritmetica è nulla:

∑ (xi-x)=0

N.B: nel caso di distribuzione statistica gli scarti devono essere moltiplicati per le

rispettive frequenze.

2) la somma dei quadrati di tutti gli scarti di un insieme di valori dalla loro media

aritmetica è minima rispetto alla somma dei quadrati degli scarti calcolati rispetto a

qualsiasi altro valore K diverso dalla media aritmetica:

∑ (xi-x) = minimo

Esempio: Data la seguente distribuzione statistica di una variabile quantitativa

discreta, calcolare la media e applicare le proprietà della media aritmetica.

xi fi xifi (xi-x) (xi-x)fi (xi-x) (xi-x) fi (xi-K) (xi-K) fi

² ² ² ²

scarto

87 1 87 -4,28 -4,28 18,31 18,31 9 9

88 2 176 -3,28 -6,56 10,75 21,5 4 8

89 2 178 -2,28 -4,56 5,2 10,4 1 2

90 3 270 -1,28 -3,84 1,64 4,92 0 0

91 7 637 -0,28 -1,96 0,078 0,546 1 7

92 3 276 0,72 2,16 0,52 1,56 4 12

93 2 186 1,72 3,44 2,95 5,9 9 18

94 3 282 2,72 8,16 7,4 22,2 16 48

95 2 190 3,72 7,44 13,85 27,3 25 50

tot 25 2282 0 113,036 148

All’inizio abbiamo soltanto le modalità xi e le rispettive frequenze fi. Per calcolare la

media occorre prima moltiplicare ogni modalità per la rispettiva frequenza (xifi), poi

sommare tutte le xifi e dividere tale somma per il totale delle frequenze

(2282/25=91,28media). Per dimostrare la prima proprietà è necessario calcolare gli

scarti di ogni modalità facendo la sottrazione tra le varie modalità e la media (es.87-

91,28=-4,28). In seguito bisogna moltiplicare ogni scarto per la frequenza della

modalità considerata (ossia (xi-x)fi es. -4,28 x 1= -4,28). La somma di tutte le (xi-x)fi



deve esser uguale a 0 (prima proprietà).

Per applicare la seconda proprietà occorre calcolare il quadrato di tutti gli scarti (xi-x)

e subito dopo moltiplicarli per la rispettiva frequenza (xi-x) fi. Poi bisogna calcolare la

somma di tutti gli (xi-x) fi (113,036). Dopo si sceglie un valore K qualsiasi che sia

diverso dalla media (es K=90), si sottrae ogni modalità per tale valore (es 87-90=-3) e si

eleva ogni valore ottenuto al quadrato (xi-K) (es. -3 x -3 = 9). Infine si moltiplicano gli

ultimi valori ottenuti per le rispettive frequenze (xi-K) fi (es.9 x 1= 9) e si calcola la

somma di esse (148). Se la somma dei quadrati di tutti gli scarti di un insieme di valori

dalla loro media aritmetica (113,036) è minima rispetto alla somma dei quadrati degli

scarti calcolati rispetto a qualsiasi altro valore K (148), la media aritmetica è corretta

(infatti 113,036<148).

Esempio: Data la seguente distribuzione statistica di una variabile quantitat

Anteprima

Vedrai una selezione di 9 pagine su 39