Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
!/BC
∑ (F − Q )
Se si vuole misurare la “distanza dall’equidistribuzione” si può considerare la quantità C = .
/ /
Siccome nell’equidistribuzione Q = F , per l’equidistribuzione si ha C = 0.
i i
In generale: Q ≤ F , C non è negativo e vale 0 per l’equidistribuzione.
i 1
Se si riesce a trovare il massimo di questa quantità lo si può normalizzare ed avere un indice che valga 0
nell’equidistribuzione e 1 nella massima concentrazione.
!/BC !OC
∑ ∑
(F − Q ) (F − Q )
Si osserva che C = = , perché F = 1 e Q = 1, per cui l’ultimo addendo della
/ / / / n n
/BC
somma lo si può togliere perché vale 0. !OC
∑ F
Nel caso particolare della massima concentrazione allora C = /
/BC
Si dice rapporto di concentrazione di Gini: $0" $0"
∑ ∑
(S O ] ) ]
! ! !
!%" !%"
R = = 1 -
$0" $0"
∑ ∑
S S
! !
!%" !%"
Esempio: 2 3 7 8 !OC
∑ Q = 0,95
2 5 12 20 /
/BC
Q 0,1 0,25 0,6 1 !OC
∑ F = 1,5
/
/BC
F = i/n 0,25 0,5 0,75 1
$0"
∑ ] 7,JE
!
!%"
R = 1 - = 1 - = 0,3667
$0"
∑ S C,E
!
!%"
Esempio: partendo da (2, 3, 7, 8) il più ricco dà 2 monete al più povero; ricalcolare il rapporto di
concentrazione.
Ci si aspetta che venga un rapporto di concentrazione più basso: se una quantità di denaro passa da una
persona più ricca ad una più povera ci si avvina ad una situazione di equidistribuzione.
/ !OC
!/BC !/BC
∑ ∑
F
1) Osservazione: = nel caso di distribuzioni unitarie; si dimostra che questa somma è = .
/ ! 6
6 !OC
∑ Q
Quindi: R = 1 - /
/BC
!OC
2) Osservazione: si parla di rapporto di concentrazione perché si basa sul confronto tra Q ed F:
Q: Q , …, Q
1 n
F: F , …, F
1 n Q Si disegnano i punti (F , Q ) che
i i
vanno a definire una spezzata a
1 segmenti crescente che prende il
nome di Curva di Lorenz.
Equidistribuzione 1 F
Massima concentrazione
Area di concentrazione
(si calcola con i trapezi)
Si può dimostrare che il rapporto di concentrazione di Gini è proprio il rapporto tra l’area di concentrazione e
l’area di massima concentrazione: ?#$( Y/ .*!.$!#(Z/*!$
R = ?#$( Y/ ^(1 .*!.$!-#(Z/*!$
(Q()$ ^(LL/*#$ 2 Q()$ ^/!*#$) 1 ?+-$ZZ(
Area trapezio = 6
Q()$ 1 ?+-$ZZ(
Area triangolo = 6
Richiami sulle formule:
Esempio: introiti pubblicitari di 9 emittenti.
Distribuzione unitaria (già ordinata crescente):
339, 461, 697, 1320, 1524, 1798, 1857, 1889, 1994
$0"
∑ ] !
!%"
R = 1 - = 0,2884 (concentrazione non altissima)
$0"
∑ S !
!%"
Esempio: dati in tabella di frequenza.
x 100 500
n 2 2
Quando i dati sono pochi, quando la tabella di frequenza è abbastanza piccola, conviene allungarla ed
esplicitarla tutta. R = 0,444
Esempio: 6 6
!OC
∑ Q
R = 1 - = 1 - x 1,15 =
/
/BC
!OC <
ordinati A Q
i i
8 -2 3
6 3 0,15 = 0,2333
3 4
3 7 0,35
2 +2 6
4 13 0,65 Si ottiene una concentrazione che è più
7 7
7 20 1 vicina all’equidistribuzione.
R = 0,3667
Se i dati sono divisi in classi non c’è bisogno di ordinarli, perché i dati divisi in classi sono tipicamente dati
già ordinati dalla classe più piccola alla più grande.
Esempio: imprese per n. di addetti
n. addetti f = n / n
n. imprese Q F
i i
i i
0,73
0-2 2.043 2.718 0,39 0,73
0,23
3-9 636 2.845 0,8 0,96
0,04
10-19 103 1.352 1 1
2.782 6.915 Non hanno un
andamento regolare
(] 2 ] )(S O S )
!/BC
∑ !0" ! ! !0"
A (area sotto la curva di Lorenz) = 6
C C C !/BC
∑ (Q + Q )(F − F )
A = – A = - /OC / / /OC
conc 6 6 6
C !OC C
≅
A =
max conc 6 ! 6
? !/BC
∑
12$1 (Q + Q )(F − F )
R = = 1 - /OC / / /OC
? 34/ 12$1
Riprendendo l’esempio precedente:
R = 1 – [(Q + Q )(F – F ) + (Q + Q )(F – F ) + (Q + Q )(F – F )] =
0 1 1 0 1 2 2 1 2 3 3 2
= 1 – [(0 + 0,39)(0,73 – 0) + (0,39 + 0,80)(0,96 – 0,73) + (0,80 + 1)(1 – 0,96)] = 0,3816
Le Q e le F partono da 0.
1) Osservazione: si potrebbero usare, nella formula, anche le frequenze relative, anziché le frequenze assolute:
!/BC
∑ (Q + Q
R = 1 - )f
/ /OC i
2) Osservazione: i valori nella colonna delle classi non si utilizzano, la colonna serve solo per mettere in ordine
le righe; i valori delle classi possono servire numericamente quando i totali non sono noti e occorre fare una
stima migliore possibile, attraverso la tecnica dei punti centrali (la frequenza moltiplicata per il centro della
classe: n x c ).
i i
Legge di pareto: l’80% della ricchezza è in mano al 20% della popolazione.
x 0,2 0,8
f 0,8 0,2
Esempio: in Italia l’1% più ricco detiene quanto il 70% più povero.
Si deve aggiungere, per calcolare l’indice di Gini, l’ipotesi che tale quantità sia 1/3 della ricchezza totale.
x 1/3 1/3 1/3
f 0,7 0,29 0,01
R = 0,46
Il rapporto di concentrazione si può addirittura calcolare quando non si ha nemmeno esplicitamente il totale, in
quanto basta la suddivisione percentuale della ricchezza perché tale rapporto si basa sia sulle quantità degli individui
sia sulle frequenze relative.
Per misurare la concentrazione non si può utilizzare la varianza, perché, dal momento che si calcola la
concentrazione per dati trasferibili, la varianza non segue le proprietà della trasformazione lineare.
Esercizio: la tabella che segue riporta la distribuzione per classi di reddito dei contribuenti di due comuni
(Camporosso e Monterosso, dati Istat 2018).
Punti medi
5.000
12.500
20.500
40.500
65.000
97.500
185.000 3.621
- Valutare il reddito medio dei contribuenti nei due comuni.
- Valutare il reddito mediano dei contribuenti nei due comuni.
- Individuare nelle due distribuzioni la classe modale.
- Disegnare l’istogramma di frequenze del reddito per il comune di Camporosso.
Chiusa a 250.000
(x1.000)
Tot. Camporosso f F
i i
6.220 0,3436 0,3436
0,5245
8.187,5 0,1809
23.001 0,3099 0,8344
21.748,5 0,1483 0,9827
2.275 0,0097 0,9922
1.950 0,0055 0,9977
0,0022 1
1.480
64.862
89.;86
x% = = 17,912
RG <.86C
La classe mediana di Caporosso è 10.000 – 15.000; di Monterosso è 15.000 – 26.000
7,E O 7,<9<8
Me = 10.000 + (5.000 )
7,E69E O 7,<9<8
Sia l’individuazione della classe modale sia l’istogramma prevedono di dover calcolare un’ulteriore quantità
nella tabella che è la densità (nel caso di distribuzioni divise in classi di intervallo la moda non è la classe
con la frequenza più alta ma quella con la densità più alta).
d = f /a
0,03436
0,0362 La densità è massima nella
0,0282 seconda classe: la classe modale
0,0051 è 10.000 – 15.000.
0,0005
0,0001 Per disegnare l’istogramma di disegnano dei rettangoli che hanno come base i vari
0,001 intervalli, le classi, e come altezza le densità.
Esercizio: nella tabella seguente è riportata la categoria professionale dei dipendenti tecnico-amministrativi
di un Ateneo, suddivisi per genere.
- Si determini la categoria mediana per l’intero collettivo dei dipendenti.
- Si determini se vi è maggiore eterogeneità nei maschi o nelle femmine.
f F
Categoria Maschi Femmine Totale i i
0,1497
0,1497
B 356 194 550 0,4853 0,635
C 859 924 1.783 0,3296 0,9646
D 770 441 1.211 0,0354 1
EP 89 41 130 1
3.674
Il primo passo da fare è calcolare il totale delle singole categorie: sulla distribuzione ottenuta si va a
calcolare la mediana, ossia la modalità in cui le frequenze cumulate relative superano il 0,05.
La modalità corrispondente alla mediana è la modalità dei dipendenti di categoria C.
Per confrontare l’eterogeneità occorre calcolare un indice di eterogeneità per la colonna dei maschi e un
indice di eterogeneità per la colonna delle femmine.
Frequenze relative
Maschi (2.074) Femmine (1.600)
B 0,1716 0,1213
C 0,4142 0,5775
D 0,3717 0,2756
EP 0,0429 0,0256
5 9
5 _6
∑ 2 2 2 2
E = (1 - ) = (1 – 0,1716 – 0,4142 – 0,3717 – 0,0429 ) = 0,879
maschi _BC
5OC <
9 2 2 2 2
E = (1 – 0,1213 – 0,5775 – 0,2756 – 0,0256 ) = 0,767
femmine <
Nel gruppo dei maschi c’è un’eterogeneità più elevata.
Esercizio: i dati seguenti rappresentano gli arrivi turistici nelle strutture ricettive in otto regioni (dati Istat
2005, in migliaia).
Si misuri il grado di concentrazione degli arrivi.
La concentrazione è una valutazione di quanto la distribuzione è distante dalla condizione di
equidistribuzione. In questo caso l’equidistribuzione sarebbe il totale che si divide equamente tra tutte le otto
regioni; la massima concentrazione sarebbe avere sette regioni in cui non va nessuno e un’unica regione in
cui vanno tutti.
Totale = 21561
La prima cosa da fare è mettere i dati in ordine: tutte le questioni relative al rapporto di concentrazione di
Gini si costruiscono dalla sequenza ordinata della distribuzione unitaria.
x A Qi = Ai /21.561
i
183 183 0.0085
1.323 1.506 0.0698
Si calcolano poi
1.455 2.961 0,1373
le cumulate
1.736 4.697 0,2178
assolute e le
2.664 7.361 0,3414
cumulate relative.
3.884 11.245 0,5215
4.198 15.443 0,7162
6.118 21.561 1
f F = i/n
1/8 1/8
1/8 2/8
Si potrebbero 1/8 3/8
anche fare le 1/8 4/8
frequenze 1/8 5/8
degli individui. 1/8 6/8
1/8 7/8
1/8 8/8
Per la distribuzione unitaria si ha la formula del rapporto di concentrazione di Gini semplificata che permette
di calcolare l’indice di Gini limitandosi a considerare la sola colonna delle Q .
i
6 !OC
∑ Q
R = 1 - = 0,4249
/
/BC
(!OC)
Esercizio: nella tabella seguente è riportata la classificazione dei comuni liguri per classi di numeri di
residenti (dati Istat al 1 gennaio 2020).
Si misuri la concentrazione dei residenti nei comuni liguri.
In questo caso la tabella è già ordinata n