Anteprima
Vedrai una selezione di 12 pagine su 53
Statistica Pag. 1 Statistica Pag. 2
Anteprima di 12 pagg. su 53.
Scarica il documento per vederlo tutto.
Statistica Pag. 6
Anteprima di 12 pagg. su 53.
Scarica il documento per vederlo tutto.
Statistica Pag. 11
Anteprima di 12 pagg. su 53.
Scarica il documento per vederlo tutto.
Statistica Pag. 16
Anteprima di 12 pagg. su 53.
Scarica il documento per vederlo tutto.
Statistica Pag. 21
Anteprima di 12 pagg. su 53.
Scarica il documento per vederlo tutto.
Statistica Pag. 26
Anteprima di 12 pagg. su 53.
Scarica il documento per vederlo tutto.
Statistica Pag. 31
Anteprima di 12 pagg. su 53.
Scarica il documento per vederlo tutto.
Statistica Pag. 36
Anteprima di 12 pagg. su 53.
Scarica il documento per vederlo tutto.
Statistica Pag. 41
Anteprima di 12 pagg. su 53.
Scarica il documento per vederlo tutto.
Statistica Pag. 46
Anteprima di 12 pagg. su 53.
Scarica il documento per vederlo tutto.
Statistica Pag. 51
1 su 53
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

!/BC

∑ (F − Q )

Se si vuole misurare la “distanza dall’equidistribuzione” si può considerare la quantità C = .

/ /

Siccome nell’equidistribuzione Q = F , per l’equidistribuzione si ha C = 0.

i i

In generale: Q ≤ F , C non è negativo e vale 0 per l’equidistribuzione.

i 1

Se si riesce a trovare il massimo di questa quantità lo si può normalizzare ed avere un indice che valga 0

nell’equidistribuzione e 1 nella massima concentrazione.

!/BC !OC

∑ ∑

(F − Q ) (F − Q )

Si osserva che C = = , perché F = 1 e Q = 1, per cui l’ultimo addendo della

/ / / / n n

/BC

somma lo si può togliere perché vale 0. !OC

∑ F

Nel caso particolare della massima concentrazione allora C = /

/BC

Si dice rapporto di concentrazione di Gini: $0" $0"

∑ ∑

(S O ] ) ]

! ! !

!%" !%"

R = = 1 -

$0" $0"

∑ ∑

S S

! !

!%" !%"

Esempio: 2 3 7 8 !OC

∑ Q = 0,95

2 5 12 20 /

/BC

Q 0,1 0,25 0,6 1 !OC

∑ F = 1,5

/

/BC

F = i/n 0,25 0,5 0,75 1

$0"

∑ ] 7,JE

!

!%"

R = 1 - = 1 - = 0,3667

$0"

∑ S C,E

!

!%"

Esempio: partendo da (2, 3, 7, 8) il più ricco dà 2 monete al più povero; ricalcolare il rapporto di

concentrazione.

Ci si aspetta che venga un rapporto di concentrazione più basso: se una quantità di denaro passa da una

persona più ricca ad una più povera ci si avvina ad una situazione di equidistribuzione.

/ !OC

!/BC !/BC

∑ ∑

F

1) Osservazione: = nel caso di distribuzioni unitarie; si dimostra che questa somma è = .

/ ! 6

6 !OC

∑ Q

Quindi: R = 1 - /

/BC

!OC

2) Osservazione: si parla di rapporto di concentrazione perché si basa sul confronto tra Q ed F:

Q: Q , …, Q

1 n

F: F , …, F

1 n Q Si disegnano i punti (F , Q ) che

i i

vanno a definire una spezzata a

1 segmenti crescente che prende il

nome di Curva di Lorenz.

Equidistribuzione 1 F

Massima concentrazione

Area di concentrazione

(si calcola con i trapezi)

Si può dimostrare che il rapporto di concentrazione di Gini è proprio il rapporto tra l’area di concentrazione e

l’area di massima concentrazione: ?#$( Y/ .*!.$!#(Z/*!$

R = ?#$( Y/ ^(1 .*!.$!-#(Z/*!$

(Q()$ ^(LL/*#$ 2 Q()$ ^/!*#$) 1 ?+-$ZZ(

Area trapezio = 6

Q()$ 1 ?+-$ZZ(

Area triangolo = 6

Richiami sulle formule:

Esempio: introiti pubblicitari di 9 emittenti.

Distribuzione unitaria (già ordinata crescente):

339, 461, 697, 1320, 1524, 1798, 1857, 1889, 1994

$0"

∑ ] !

!%"

R = 1 - = 0,2884 (concentrazione non altissima)

$0"

∑ S !

!%"

Esempio: dati in tabella di frequenza.

x 100 500

n 2 2

Quando i dati sono pochi, quando la tabella di frequenza è abbastanza piccola, conviene allungarla ed

esplicitarla tutta. R = 0,444

Esempio: 6 6

!OC

∑ Q

R = 1 - = 1 - x 1,15 =

/

/BC

!OC <

ordinati A Q

i i

8 -2 3

6 3 0,15 = 0,2333

3 4

3 7 0,35

2 +2 6

4 13 0,65 Si ottiene una concentrazione che è più

7 7

7 20 1 vicina all’equidistribuzione.

R = 0,3667

Se i dati sono divisi in classi non c’è bisogno di ordinarli, perché i dati divisi in classi sono tipicamente dati

già ordinati dalla classe più piccola alla più grande.

Esempio: imprese per n. di addetti

n. addetti f = n / n

n. imprese Q F

i i

i i

0,73

0-2 2.043 2.718 0,39 0,73

0,23

3-9 636 2.845 0,8 0,96

0,04

10-19 103 1.352 1 1

2.782 6.915 Non hanno un

andamento regolare

(] 2 ] )(S O S )

!/BC

∑ !0" ! ! !0"

A (area sotto la curva di Lorenz) = 6

C C C !/BC

∑ (Q + Q )(F − F )

A = – A = - /OC / / /OC

conc 6 6 6

C !OC C

A =

max conc 6 ! 6

? !/BC

12$1 (Q + Q )(F − F )

R = = 1 - /OC / / /OC

? 34/ 12$1

Riprendendo l’esempio precedente:

R = 1 – [(Q + Q )(F – F ) + (Q + Q )(F – F ) + (Q + Q )(F – F )] =

0 1 1 0 1 2 2 1 2 3 3 2

= 1 – [(0 + 0,39)(0,73 – 0) + (0,39 + 0,80)(0,96 – 0,73) + (0,80 + 1)(1 – 0,96)] = 0,3816

Le Q e le F partono da 0.

1) Osservazione: si potrebbero usare, nella formula, anche le frequenze relative, anziché le frequenze assolute:

!/BC

∑ (Q + Q

R = 1 - )f

/ /OC i

2) Osservazione: i valori nella colonna delle classi non si utilizzano, la colonna serve solo per mettere in ordine

le righe; i valori delle classi possono servire numericamente quando i totali non sono noti e occorre fare una

stima migliore possibile, attraverso la tecnica dei punti centrali (la frequenza moltiplicata per il centro della

classe: n x c ).

i i

Legge di pareto: l’80% della ricchezza è in mano al 20% della popolazione.

x 0,2 0,8

f 0,8 0,2

Esempio: in Italia l’1% più ricco detiene quanto il 70% più povero.

Si deve aggiungere, per calcolare l’indice di Gini, l’ipotesi che tale quantità sia 1/3 della ricchezza totale.

x 1/3 1/3 1/3

f 0,7 0,29 0,01

R = 0,46

Il rapporto di concentrazione si può addirittura calcolare quando non si ha nemmeno esplicitamente il totale, in

quanto basta la suddivisione percentuale della ricchezza perché tale rapporto si basa sia sulle quantità degli individui

sia sulle frequenze relative.

Per misurare la concentrazione non si può utilizzare la varianza, perché, dal momento che si calcola la

concentrazione per dati trasferibili, la varianza non segue le proprietà della trasformazione lineare.

Esercizio: la tabella che segue riporta la distribuzione per classi di reddito dei contribuenti di due comuni

(Camporosso e Monterosso, dati Istat 2018).

Punti medi

5.000

12.500

20.500

40.500

65.000

97.500

185.000 3.621

- Valutare il reddito medio dei contribuenti nei due comuni.

- Valutare il reddito mediano dei contribuenti nei due comuni.

- Individuare nelle due distribuzioni la classe modale.

- Disegnare l’istogramma di frequenze del reddito per il comune di Camporosso.

Chiusa a 250.000

(x1.000)

Tot. Camporosso f F

i i

6.220 0,3436 0,3436

0,5245

8.187,5 0,1809

23.001 0,3099 0,8344

21.748,5 0,1483 0,9827

2.275 0,0097 0,9922

1.950 0,0055 0,9977

0,0022 1

1.480

64.862

89.;86

x% = = 17,912

RG <.86C

La classe mediana di Caporosso è 10.000 – 15.000; di Monterosso è 15.000 – 26.000

7,E O 7,<9<8

Me = 10.000 + (5.000 )

7,E69E O 7,<9<8

Sia l’individuazione della classe modale sia l’istogramma prevedono di dover calcolare un’ulteriore quantità

nella tabella che è la densità (nel caso di distribuzioni divise in classi di intervallo la moda non è la classe

con la frequenza più alta ma quella con la densità più alta).

d = f /a

0,03436

0,0362 La densità è massima nella

0,0282 seconda classe: la classe modale

0,0051 è 10.000 – 15.000.

0,0005

0,0001 Per disegnare l’istogramma di disegnano dei rettangoli che hanno come base i vari

0,001 intervalli, le classi, e come altezza le densità.

Esercizio: nella tabella seguente è riportata la categoria professionale dei dipendenti tecnico-amministrativi

di un Ateneo, suddivisi per genere.

- Si determini la categoria mediana per l’intero collettivo dei dipendenti.

- Si determini se vi è maggiore eterogeneità nei maschi o nelle femmine.

f F

Categoria Maschi Femmine Totale i i

0,1497

0,1497

B 356 194 550 0,4853 0,635

C 859 924 1.783 0,3296 0,9646

D 770 441 1.211 0,0354 1

EP 89 41 130 1

3.674

Il primo passo da fare è calcolare il totale delle singole categorie: sulla distribuzione ottenuta si va a

calcolare la mediana, ossia la modalità in cui le frequenze cumulate relative superano il 0,05.

La modalità corrispondente alla mediana è la modalità dei dipendenti di categoria C.

Per confrontare l’eterogeneità occorre calcolare un indice di eterogeneità per la colonna dei maschi e un

indice di eterogeneità per la colonna delle femmine.

Frequenze relative

Maschi (2.074) Femmine (1.600)

B 0,1716 0,1213

C 0,4142 0,5775

D 0,3717 0,2756

EP 0,0429 0,0256

5 9

5 _6

∑ 2 2 2 2

E = (1 - ) = (1 – 0,1716 – 0,4142 – 0,3717 – 0,0429 ) = 0,879

maschi _BC

5OC <

9 2 2 2 2

E = (1 – 0,1213 – 0,5775 – 0,2756 – 0,0256 ) = 0,767

femmine <

Nel gruppo dei maschi c’è un’eterogeneità più elevata.

Esercizio: i dati seguenti rappresentano gli arrivi turistici nelle strutture ricettive in otto regioni (dati Istat

2005, in migliaia).

Si misuri il grado di concentrazione degli arrivi.

La concentrazione è una valutazione di quanto la distribuzione è distante dalla condizione di

equidistribuzione. In questo caso l’equidistribuzione sarebbe il totale che si divide equamente tra tutte le otto

regioni; la massima concentrazione sarebbe avere sette regioni in cui non va nessuno e un’unica regione in

cui vanno tutti.

Totale = 21561

La prima cosa da fare è mettere i dati in ordine: tutte le questioni relative al rapporto di concentrazione di

Gini si costruiscono dalla sequenza ordinata della distribuzione unitaria.

x A Qi = Ai /21.561

i

183 183 0.0085

1.323 1.506 0.0698

Si calcolano poi

1.455 2.961 0,1373

le cumulate

1.736 4.697 0,2178

assolute e le

2.664 7.361 0,3414

cumulate relative.

3.884 11.245 0,5215

4.198 15.443 0,7162

6.118 21.561 1

f F = i/n

1/8 1/8

1/8 2/8

Si potrebbero 1/8 3/8

anche fare le 1/8 4/8

frequenze 1/8 5/8

degli individui. 1/8 6/8

1/8 7/8

1/8 8/8

Per la distribuzione unitaria si ha la formula del rapporto di concentrazione di Gini semplificata che permette

di calcolare l’indice di Gini limitandosi a considerare la sola colonna delle Q .

i

6 !OC

∑ Q

R = 1 - = 0,4249

/

/BC

(!OC)

Esercizio: nella tabella seguente è riportata la classificazione dei comuni liguri per classi di numeri di

residenti (dati Istat al 1 gennaio 2020).

Si misuri la concentrazione dei residenti nei comuni liguri.

In questo caso la tabella è già ordinata n

Dettagli
A.A. 2023-2024
53 pagine
SSD Scienze economiche e statistiche SECS-S/01 Statistica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher alessiaresyferrara di informazioni apprese con la frequenza delle lezioni di Statistica e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli studi di Genova o del prof Corrado Lagazio.