Che materia stai cercando?

Anteprima

ESTRATTO DOCUMENTO

ESEMPIO.

46 famiglie classificate secondo il reddito annuale percepito da ciascuna di esse.

REDDITO AMPIEZZA

N° FAMIGLIE DENSITÀ

α

x x N d

+ i i

i i 1 i

2 – 4 8 2 4

4 – 6 10 2 5

6 – 10 12 4 3

10 – 14 10 4 2,5

14 – 20 6 6 1

46

Si usano le densità di frequenza e non le frequenze assolute per l’altezza dei rettangoli, per

eliminare l’influenza perturbatrice della diversa ampiezza della classe. Se usassimo le frequenze

assolute verrebbe una rappresentazione grafica distorta che non rappresenterebbe effettivamente

l’andamento del fenomeno. Ciò perché la somma delle aree dei singoli rettangoli deve dare la

frequenza assoluta totale. 16

LE MEDIE.

La media è un parametro, ossia un unico valore, che si usa quando si vuol rappresentare una

distribuzione con un unico valore. Dunque è un parametro di sintesi, in quanto sintetizza la

distribuzione e può essere utilizzato sia per caratteri qualitativi che per caratteri quantitativi.

Capita, però, che le distribuzioni risentano di valori estremi. Su 70 persone, tra cui 65 guadagnano

1200, 1400, 1500 ecc, e 5 persone che guadagnano 10 mln di euro, la media verrebbe un valore

altissimo che non rispecchierebbe il reddito medio della maggior parte delle persone. Per cui non

sono opportune da usare le medie di calcolo che risentono dei valori estremi, ma solo le medie di

posizione, altrimenti dette lasche.

Le medie di posizione sono quelle che si ottengono considerando soltanto alcuni valori della

distribuzione.

LA MODA.

La moda è una media di posizione che non risente dei valori estremi, in quanto rappresenta

l’intensità che ha la maggior frequenza nella distribuzione.

Definizione: −

data una variabile statistica, la moda è quel valore interno all’intervallo x x tale che la sua

+

i i 1

frequenza risponda alla seguente disuguaglianza: N N +

i i 1

N N −

i i 1

Quindi la moda è l’intensità o la modalità che ha la frequenza maggiore rispetto alla precedente e

alla successiva. GIUDIZI FREQUENZE

x N

i

i

Insufficiente 2

Sufficiente 3

Buono 2

Ottimo 1

8

Il giudizio modale è “Sufficiente” in quanto ha la frequenza maggiore della precedente e della

successiva. 17

In questo caso siamo di fronte ad una distribuzione bimodale in quanto

x N

i

i abbiamo due valori a rappresentare la moda della distribuzione. L’intensità

1 2 “3” e l’intensità “6”, le quali presentano, appunto, frequenze assolute

2 3 maggiori delle precedenti e delle successive.

3 7

4 6

5 5

6 9

7 5

8 4

Se ci si ritrova a lavorare su un carattere quantitativo continuo, quindi organizzato in classi di

intensità, ci si presentano due casi per calcolare il valore modale:

1. se le classi sono di diversa ampiezza, la moda sarà contenuta nella classe che ha densità di

frequenza maggiore della precedente e della successiva;

2. se le classi sono di uguale ampiezza, la moda sarà interna alla classe che ha frequenza

assoluta maggiore della precedente e della successiva.

REDDITO N d

i i

x x +

i i 1

2 – 4 8 4

4 – 6 10 5

6 – 10 12 3

10 – 14 10 2,5

14 – 20 6 1

46

In questo caso la moda è un valore interno alla classe 4 – 6, che prende il nome di classe modale,

perché presenta una densità di frequenza maggiore della precedente e della successiva. 18

LA MEDIANA o VALORE MEDIANO o SECONDO QUARTILE.

Definizione: ordinando le intensità in senso crescente, la mediana è l’intensità che bipartisce la

distribuzione.

Se le intensità sono dispari si ha una sola mediana a bipartire la distribuzione, mentre invece se le

intensità sono pari se ne hanno due. Quindi abbiamo due casi per determinare il posto della

mediana: + 1

N

=

1. Se N è dispari il posto della mediana sarà dato da: ;

P 2

N N

= = +

2. Se N è pari i posti delle mediane saranno dati da: e .

P P 1

1 2

2 2

ESEMPIO 1:

ho nove intensità: 2, 5, -1, 9, 6, 11, 4, -3, 1

Ordino le intensità in ordine crescente: -3, -1, 1, 2, 4, 5, 6, 9, 11

+ +

N 1 9 1

= = =

⇒ , quindi la mediana è

Il posto del valore che bipartisce la distribuzione è: P P 5

2 2

rappresentata dall’intensità “4”.

La moda invece è 0, quindi siamo di fronte ad una distribuzione zero modale, in quanto è a

frequenza unitaria.

ESEMPIO 2:

ho dieci intensità già ordinate in senso crescente: -3, -1, 1, 2, 4, 5, 6, 9, 11, 13

10 10

= = = + =

I posti delle mediane mi sono dati da: e

P 5 P 1 6

1 2

2 2

Quindi ho la mediana rappresentata dai valori “4” e “5”. Vado a calcolare la media tra i due valori:

+

4 5 = e questa, per convenzione, rappresenta la mediana della successione di intensità.

4

,

5

2

I QUARTILI.

Presupponiamo di avere una distribuzione rappresentata da una linea retta:

3 4

1 Q M

2 e

4 2 Q

0 Q 1 3

4 19

I quartili sono tre: 1 4

1. Primo quartile, il quale, partendo da zero, lascia alla sua sinistra dei casi;

2 4

2. La mediana o secondo quartile, partendo da zero, lascia alla sua sinistra dei casi;

3 4

3. Il terzo quartile, partendo da zero, lascia alla sua sinistra i dei casi.

Data una distribuzione ordinata in senso crescente: -3 -1 1 2 4 5 6 9 11.

Si calcola il posto del primo quartile mediante l’equazione: , dove N sta ad indicare il

1

P 9 2,25 3.

Q1 4

numero dei casi della distribuzione; in tal caso Non esistendo il posto 2,25 per

convenzione si arrotonda al posto successivo. Di conseguenza il primo quartile risulta essere

1).

l’intensità 1 (

Per ottenere il posto del terzo quartile utilizzerò l’equazione ; nel nostro esempio

9 6,75 7. 6).

Per cui il terzo quartile risulta essere l’intensità 6 (

Nel caso in cui la distribuzione di frequenze si dispari ma non sia unitaria:

COMPONENTI

FAMIGLIE

1 7 7

2 10 17

3 9 26

4 6 32

5 3 35

35

Vogliamo determinare il primo, il secondo e il terzo quartile. 18,

Il posto della mediana o secondo quartile lo otteniamo in maniera seguente:

in quanto le famiglie, quindi le frequenze, sono di numero dispari.

Per individuare l’intensità che occupa il diciottesimo posto ricorro all’utilizzo delle frequenze

cumulate, altrimenti incorrerei in un percorso lungo, facinoroso e non sempre possibile.

Ad esempio, volendo utilizzare un metodo bizzarro, potrei rappresentare la distribuzione nel

seguente modo:

11111112222222222333333333444444555

In tal modo, contando i posti, arrivo alla conclusione che la mediana è rappresentata dal valore “3”,

che è la prima delle 9 frequenze di detta intensità. Non sempre questo metodo è però utilizzabile, in

quanto si può avere una distribuzione molto più corposa. 20

Mediante le frequenze cumulate, invece, noto subito che la seconda intensità ha frequenza cumulata

17, per cui, dovendo io individuare il diciottesimo posto, mi rendo conto immediatamente che

questo è occupato dalla prima intensità “3” delle 9 riscontrate nella distribuzione.

" 8,75 9.

Il primo quartile è calcolato nella stessa modalità: Il posto 9 ricade nelle

2.

frequenze dell’intensità “2”, quindi 35 26,25 27.

Il posto del terzo quartile lo otteniamo nella medesima maniera: Il

4.

posto 27 ricade nelle frequenze dell’intensità “4”, quindi

Nel caso in cui la distribuzione sia pari avremo:

COMPONENTI

FAMIGLIE

1 7 7

2 10 17

3 9 26

4 6 32

5 2 34

34

Per determinare il posto della mediana agisco nel seguente modo:

17; 2;

$1 18; 3;

# #

Il primo quartile si calcola:

34

1 8,5 9; 2;

4 4

Il terzo quartile sarà:

3 3 102

34 25,5 26; 3;

4 4 4

Qualora le intensità siano espresse in classi avremo:

&

REDDITO

'

2 – 4 8 8

4 – 6 10 18

6 – 10 12 30

10 – 14 10 40

14 – 20 6 46

46 21

Una volta determinata la classe mediana, per calcolare il valore mediano preciso all’interno di essa,

si usufruisce della seguente formula: , - /

( ) $ & .

*

*+ *+

*

Dove:

0

*+ sta ad indicare l’estremo inferiore della classe mediana;

, * sta ad indicare l’ampiezza della classe mediana;

* indica la frequenza assoluta della classe mediana;

è il posto della mediana all’interno della classe;

.

*+ sarebbe la frequenza cumulata precedente alla classe mediana.

Le frequenze sono 46, per cui pari, allora procediamo nel seguente modo:

23; $1 24;

#

I posti 23 e 24 si trovano nella classe che ha frequenza cumulata 30, quindi la classe mediana è 6 –

10.

Dunque avremo:

4 -23

( 6$ & 18/ 7,6

# 12

4 -24

( 6 $ & 28/ 7,8

12

MEDIE DI CALCOLO.

Le medie di calcolo, anch’esse, si utilizzano per rappresentare una distribuzione con un unico

parametro.

Definizione di Cauchy. ) & )

1

La media è qualsiasi valore interno all’intervallo :

) 3 )4 3 )

1

In realtà la media molto raramente coincide con i valori estremi, ma è sempre un valore centrale

rappresentante l’intera distribuzione.

Definizione di Chisini.

La media è quel valore unico che sostituito alle singole intensità lascia immutato il risultato di

alcune operazioni. In pratica la media è invariante rispetto a certe operazioni.

Esempio:

5 10 15 50 Somma: 80 Media: 20

Si nota che la media aritmetica è invariante rispetto alla somma. 22

Media aritmetica.

Se assumo come invariante distributivo la somma delle intensità, la media aritmetica è quell’unico

valore che sostituito a ciascuna intensità lascia invariata la somma delle intensità.

) $ ) $ 5 $ ) 6 $ 6 $ 5$ 6

1

1

7 ) :·6

8

89 ∑ )

189

6 8

:

Media quadratica.

Se assumo come invariante distributivo la somma dei quadrati delle intensità, la media quadratica è

quell’unico valore che sostituito a ciascuna intensità lascia invariata la somma dei quadrati delle

intensità.

) $ ) $ 5 $ ) $ $ 5$

1

1

7 ) :·

8

89 ∑ )

1

= 8

89

:

Media armonica.

Se assumo come invariante distributivo la somma dei reciproci delle intensità, la media armonica è

quell’unico valore che sostituito a ciascuna intensità lascia invariata la somma dei reciproci delle

intensità.

1 1 1 1 1 1

$ $ 5$ $ $ 5$

) ) ) > > >

1

1 1 1

7 :·

) >

8

89 :

> 1

∑ 189 )

8

Le medie derivano da una formula generale che è la media di potenza di ordine R.

∑ )

189 8@

=

A

( :

?

Se R = 1 abbiamo la media aritmetica;

Se R = 2 abbiamo la media quadratica;

Se R = -1 abbiamo la media armonica. 23

Dunque, dal valore che vado ad assegnare ad R, dipende il tipo di media che io ottengo. Le medie,

in teoria, sono quindi infinite, ma certo non vengono utilizzate.

C’è da dire che ogni media ha delle proprietà, a noi interessa la proprietà più importante che si

riferisce alla media aritmetica. La prima proprietà è detta variabile scarto dalla media aritmetica,

scarto in quanto differenza tra le intensità e la media da esse derivante:

∑ -) & 6/ 0

189 8

1. La somma delle differenze tra ciascuna intensità e la media aritmetica è sempre zero;

∑ -) ∑ -) ∑ -)

& 6/ BC:CBD & 6/ E & (/ ( F 6

189 189 189

8 8 8 :

2. La somma delle differenze elevate al quadrato tra ciascuna intensità e la media aritmetica è un

minimo:se attuassi lo stesso procedimento con un valore M diverso da A verrebbe un valore

necessariamente maggiore.

ESEMPIO. ) 1,5 ) 0,6 ) 2,8 ) 5,2 ) 4,9

"

Redditi di cinque persone:

Calcolo la media aritmetica:

∑ )

189

6 8

:

1,5 $ 0,6 $ 2,8 $ 5,2 $ 4,9 3

5

Verifico la prima proprietà della variabile scarto dalla media aritmetica:

1

7-) & 6/ 0

8

89

-1,5 -0,6 -2,8 -5,2 -4,9

& 3/ $ & 3/ $ & 3/ $ & 3/ $ & 3/

&1,5 & 2,4 & 0,2 $ 2,2 $ 1,9 0

Verifico la seconda proprietà della variabile scarto dalla media aritmetica:

1 -)

7 & 6/ BC:CBD

8

89

-1,5 -0,6 -2,8 -5,2 -4,9

& 3/ $ & 3/ $ & 3/ $ & 3/ $ & 3/ 16,5

1 1

7-) & 6/ E 7-) & (/

8 8

89 89

( 2; ( 4.

-1,5 -0,6 -2,8 -5,2 -4,9

& 2/ $ & 2/ $ & 2/ $ & 2/ $ & 2/ 21,5;

-1,5 -0,6 -2,8 -5,2 -4,9

& 4/ $ & 4/ $ & 4/ $ & 4/ $ & 4/ 21,5.

Ma esistono anche altre medie, quindi vediamo come a questa distribuzione di intensità come si

applicano la media quadratica e la media armonica. 24

'

G

1,5 2,25 0,6

0,6 0,36 1,6

2,8 7,84 0,36

5,2 27,04 0,19

4,9 24,01 0,20

61,5 2,95

Calcoliamo dunque la media quadratica:

∑ )

1

= 8

89

:

Vado a sostituire: al numeratore la somma dei quadrati di ciascuna intensità; al denominatore il

numero di intensità.

61,5

= 3,50

5

Calcoliamo la media armonica:

:

> 1

189 )

8

Vado a sostituire: al numeratore il numero di intensità; al denominatore la somma dei reciproci di

ciascuna intensità.

5

> 2,69

2,95

Ovviamente utilizzare le varie medie non ha lo stesso significato, ma queste vanno scelte in base ad

alcune esigenze.

ESEMPIO:

sono stati dati tre quadrati con lati rispettivamente di cm 5, 16, 12. Volendo sostituirli con tre

quadrati identici, in modo tale che la loro area complessiva rimanga invariata, quale deve essere la

lunghezza del lato di questi nuovi quadrati?

2 2 2 2

25 cm + 256 cm + 144 cm = 425 cm

Dovendo lasciare invariati la somma dei quadrati, allora risulta utile calcolare la media quadratica:

H L

∑ K

I H " 11,9024 OB

JMN J

1 ; 25

Derivando, le medie, tutte dalla media di potenza di ordine R ne scaturisce che sono soggette ad un

ordine di grandezza. Infatti la media armonica sarà minore della media aritmetica, la quale a sua

> E 6 E

volta è minore della media quadratica: . Le medie si applicano quindi seguendo tale

logica, derivante dalla definizione di Chisini.

Anche in questo caso abbiamo lavorato su successioni di intensità, mentre si può avere anche una

distribuzione di frequenze di un carattere discontinuo o continuo.

Andiamo ad analizzare come si calcolano le medie quando si è in presenza di una distribuzione di

frequenze di carattere discreto o discontinuo. ' ·

· ·

G

2 3 6 12 1,5

3 12 36 108 4

5 1 5 25 0,20

16 47 145 5,7

In questo caso, essendo la frequenza non unitaria, le medie vanno ponderate, ossia si va a

moltiplicare numeratore e denominatore per il numero delle frequenze.

Media aritmetica ponderata:

∑ ) · 47

189

6 2,93

8 8

:· 16

8

Media quadratica ponderata:

∑ ) 145

1 =

= 3,01

8 8

89

∑ 16

1 8

89

Media armonica ponderata:

∑ 16

189

> 2,8

8

1 5,7

∑ 189 ) 8

8

Quando il carattere è continuo ho una distribuzione di intensità organizzata, ovviamente, in classi di

intensità. Per poter calcolare le medie vado a sostituire alle classi il loro valore centrale:

I I

)

Q J JRN

P .

ESEMPIO:

ho 52 operai organizzati secondo l’anzianità di lavoro in anni compiuti. 26

INDICI DI VARIABILITÀ.

Le medie, abbiamo sin qui detto, servono per rappresentare con un unico parametro una

distribuzione. Il problema è che le distribuzioni sono diverse, ma può capitare che la media risulti

essere uguale. Quindi la media, da sola, non rispecchia fedelmente la realtà, motivo per cui le

affianchiamo altri indici che ci danno conto del tipo di variabilità che c’è nella distribuzione.

ESEMPIO.

presupponiamo di avere tre studenti tra loro molto diversi che hanno i seguenti voti:

I Studente: 5 5 5 5 5 A=5

II Studente: 4 5 6 6 4 A=5

III Studente: 2 9 4 3 7 A=5

Dunque, per dare dei giudizi opportuni su questi studenti, devo affiancare gli indici di variabilità.

Lo specifico scopo degli indici di variabilità è quello di compensare al fatto di dover rappresentare

la distribuzione con un unico parametro, quindi con una media. Questi debbono avere due

caratteristiche:

1. Essere uguali a 0 (zero) quando le intensità sono tutte uguali;

2. Essere tanto maggiori quanto maggiore è il grado di disuguaglianza fra le singole intensità.

Gli indici di variabilità si distinguono in due grandi gruppi: indici di posizione ed indici di calcolo.

INDICI DI POSIZIONE.

Il primo indice di variabilità di posizione si chiama campo di variazione, che è quello più

S ) & )

*TI *81

grossolano: , ossia la differenza tra l’intensità più grande della distribuzione e la

più piccola.

Il secondo indice di variabilità di posizione più usato è la differenza interquartilica, che è la

&

differenza tra il terzo e il primo quartile: .

Questi indici sono però molto grossolani, motivo per cui non sono molto usati nei calcoli statistici.

INDICI DI CALCOLO.

Il primo gruppo si ottiene facendo le differenze tra ciascuna intensità della distribuzione e una

media e sintetizzando queste differenze con una ulteriore media, che può essere aritmetica o

quadratica. Questi indici misurano la dispersione dei dati intorno alla media di riferimento.

Scarto semplice medio dalla media aritmetica:

∑ |) & 6|

189

U 8

:

V

I valori vanno presi in assoluto in quanto gli scarti dalla media aritmetica danno come risultato 0

(zero), ma la cosa non può essere in quanto deve essere possibile rappresentare la variabilità

all’interno della distribuzione. 27

Scarto semplice medio dalla mediana:

∑ |) |

& (

189

U 8

:

Scarto quadratico medio dalla media aritmetica:

∑ -) & 6/

189

=

X 8

:

Varianza:

∑ -) & 6/

189

X 8

:

Devianza: 1

YZ[ 7-) & 6/

-I/ 8

89

Nel caso di distribuzione di frequenze tutte le formule degli scarti vanno ponderate, per tener conto

delle frequenze diverse da 1 (uno).

Scarto semplice medio ponderato dalla media aritmetica:

∑ |) & 6| ·

189

U 8 8

V 189 8

Scarto semplice medio ponderato dalla mediana:

∑ |) |

& ( ·

189

U 8 8

∑ 189 8

Scarto quadratico medio ponderato dalla media aritmetica:

∑ -) & 6/ ·

189

=

X 8 8

∑ 189 8

Varianza ponderata:

∑ -) & 6/ ·

189

X 8 8

∑ 189 8

Devianza ponderata:

1

YZ[ 7-) & 6/ ·

-I/ 8 8

89 28

ESEMPIO:

Prendiamo in esame un supermercato e abbiamo i ricavi mensili di questo in cinque quartieri

diversi.

) 5,0 ) 4,8 ) 9,9 ) 4,9 ) 8,9

8 "

; ; ; ; |) |) | -)

) ) & 6 & 6| & ( & 6/

8 8 8 8 8

4,8 -1,9 1,9 0,2 3,61

4,9 -1,8 1,8 0,1 3,24

5,0 -1,7 1,7 0 2,89

8,9 2,2 2,2 3,9 4,84

9,9 3,2 3,2 4,9 10,24

10,8 9,1 24,82

In primis posso ottenere il ricavo medio attraverso la media aritmetica:

5 $ 4,8 $ 9,9 $ 4,9 $ 8,9

6 6,7

5

Calcolo poi gli scarti intorno alla media aritmetica, ossia quanto si discostano, mediamente, da essa

i ricavi. In questo caso si può utilizzare la formula semplice e non ponderata perché la frequenza è

unitaria.

∑ |) & 6| 10,8

189

U 2,16

8

: 5

V

Ciò significa che ho una variabilità intorno alla media aritmetica, in più e in meno, di 2,16.

Calcolo la mediana per poter calcolare lo scarto medio intorno alla mediana:

$1 3

2

\

Ordinate le intensità in ordine crescente, la mediana risulta essere 5,0.

Calcolo ora lo scarto medio intorno alla mediana:

∑ |) & (]| 9,1

189

U 1,82

8 5

:

In genere quello più usato è lo scarto quadratico medio, che si ottiene così facendo:

24,82

=

X ^4,96 2,22

5

YZ[

-I/

La risulta essere, dalla tabella di calcolo, 24,82.

La varianza altro non è che l’elevazione al quadrato dello scarto quadratico medio:

X 4,96. 29

INDICI DI DISUGUAGLIANZA.

Esiste poi un altro tipo di indice che non fa riferimento alle medie, ma misura la disuguaglianza dei

dati tra loro, cioè mediamente quanto i dati sono disuguali fra loro.

Questi indici si ottengono confrontando le intensità a due a due e poi le sintetizzo, queste differenze,

con una media, o aritmetica o quadratica.

Differenza media con ripetizione:

∑ `) & ) `

8,a 8 a

∆ :

@

Differenza media senza ripetizione:

∑ `) & ) `

8,a 8 a

∆ - & 1/

Esempio:

) 5,0 ) 4,8 ) 9,9 ) 4,9 ) 8,9

8 "

; ; ; ;

Faccio una matrice per semplificare i calcoli:

4,8 4,9 5,0 8,9 9,9

4,8 0 -0,1 -0,2 -4,1 -5,1

4,9 0,1 0 -0,1 -4,0 -5,0

5,0 0,2 0,1 0 -3,9 -4,9

8,9 4,1 4 3,9 0 -1,0

9,9 5,1 5 4,9 1 0

La diagonale degli zeri (0) divide i valori, da un lato con il segno negativo e dall’altro con il segno

positivo, motivo per cui debbo prendere i valori in assoluto. Per semplificare i calcoli vado a

moltiplicare per due la somma dei valori, presi una sola volta.

2|0,1 $ 0,2 $ 4,1 $ 5,1 $ 0,1 $ 4 $ 5 $ 3,9 $ 4,9 $ 1|

∆ 2,27

25

@

L’altra formula esclude gli zeri dalla somma delle frequenze, quindi invece di 25 il denominatore

sarà 20.

2|0,1 $ 0,2 $ 4,1 $ 5,1 $ 0,1 $ 4 $ 5 $ 3,9 $ 4,9 $ 1|

∆ 2,84

20

Il problema sorge nel momento in cui andiamo ad analizzare più distribuzioni contemporaneamente,

magari anche con Unità di Misura diverse, prendendo in considerazione più caratteri.

Prendendo un collettivo diviso per sesso e classificato, di conseguenza, rispetto al peso e all’altezza,

nel voler verificare la variabilità debbo calcolare la media dei due caratteri per le due distribuzioni,

30

maschili e femminili. Una volta ottenuto, ad esempio, il peso medio dei due sessi, calcolo la

variabilità con lo scarto quadratico medio. Non è però possibile confrontare lo scarto quadratico

medio delle due distribuzioni, pur essendo il fenomeno espresso nella medesima unità di misura

perché è diversa la media. Tanto meno potrei fare questo confronto tra il peso e l’altezza perché è

differente l’unità di misura.

Quindi per poter effettuare una comparazione tra distribuzioni ci si svincola dall’unità di misura,

dividendo lo scarto quadratico medio per la media, ottenendo un indice adimensionale espresso in

percentuale, il coefficiente di variazione: X

.[ 100

6

Il coefficiente di variazione è un indice di variabilità relativa svincolato dall’unità di misura

espresso in percentuale della media. Questo è utile nell’accertare la differenza di variabilità nelle

distribuzioni messe a confronto (ES: se c’è più variabilità nel peso o nell’altezza).

Altri indici utilizzabili, ma meno importanti, sono il rapporto tra lo scarto semplice medio dalla

media aritmetica e la media aritmetica stessa, oppure il rapporto tra lo scarto semplice medio dalla

mediana e la mediana, entrambi espressi in percentuale.

ESERCIZIO.

Cinque ragazzi classificati secondo il peso e l’altezza. Misurare in quale delle due distribuzioni c’è

più variabilità

) b

8 8 cb & 6 d

c) & 6 d cb & 6 d

c) & 6 d

-e/

-I/ 8

8 -e/

-I/ 8

8

Peso (Kg) Altezza (cm)

93 184 5,8 3,8 33,64 14,44

79 168 -8,2 -12,2 67,24 148,84

86 180 -1,2 -0,2 1,44 0,04

94 184 6,8 3,8 46,24 14,44

84 185 -3,2 4,8 10,24 23,04

436 901 158,8 200,8

Per prima cosa si procede al calcolo delle medie di peso e altezza:

436

6 87,2 fg

5

-I/ 901

6 180,2 OB

5

-e/ 31

Come secondo step si calcolano gli scarti quadratici medi:

∑ -) 158,8

& 6/

1

= =

X 5,63 fg

8

89 5

-I/ ∑ -b & 6/ 200,8

1

= =

X 6,33 OB

8

89 5

-e/

A questo punto si può procedere al calcolo del coefficiente di variabilità:

X 5,63

.[ 100 100 6,45%

6 87,2

-I/ -I/

X 6,33

.[ 100 100 3,51%

6 180,2

-e/ -e/

Il che sta a significare che c’è maggiore variabilità del peso rispetto all’altezza.

Vi è un ulteriore indice di variabilità relativo denominato rapporto di concentrazione di Gini

utilizzato per i caratteri trasferibili. I caratteri trasferibili si possono trasferire da un’unità statistica

ad un’altra, ossia da un soggetto ad un altro (reddito, patrimonio, etc).

Presupponiamo di avere un gruppo N di persone con vari patrimoni, avremo una sequenza di

variabili poste in ordine crescente:

) E ) E ) E 5 E 5)

Per calcolare l’indice di concentrazione di Gini bisogna calcolare le frequenze relative cumulate e le

intensità relative cumulate. i J

8

Frequenze relative cumulate:

Quindi si ha:

1 2 3

; ; ;… 1

U

8

Le intensità cumulate sono denominate

U ) ; U ) $) ;U ) $ ) $ ) ;…U ) $ ) $ ) $ 5 $ )

1

m

l J

8 m

Intensità relative cumulate: n

Avremo dunque:

U U U

l ;l ;…;l 1

U U U 32

ESEMPIO.

Ho quattro persone che hanno un certo numero di azioni della Telecom

o l

)

AZIONISTI AZIONI

8 8

8 8

1 25 1

l

4 100 4

1 25

2 2

4 4

1 25

3 3

4 4

1 25

1 1

1 25

4 100

In questo caso la variabilità è zero, perché tutte le persone hanno lo stesso ammontare del carattere.

Se calcolassi l’indice di variabilità sarebbe zero e quindi anche l’indice relativo di variabilità, cioè il

rapporto di concentrazione di Gini, dovrebbe risultare zero. o l

8 8

sono uguali alle .

Quando ci si trova in situazione di equidistribuzione, come in tal caso, le

Nel caso reale è difficile trovarsi in equidistribuzione, quindi ogni azionista avrà una sua quota di

azioni diversa da quelle degli altri.

o ) l

8 8 8 8

1 1

4 10

1 10

2 1

4 4

1 15

3 1 2

4 1 25

1 1 50 1

4 100

o l

8 8

Maggiore è la differenza tra le e le e maggiore è la concentrazione, fino ad arrivare al caso

estremo in cui si ha la massima concentrazione, come da tabella seguente

o ) l

8 8 8 8

1 4 1 0 0

2 4 1 0 0

3 4 1 0 0

1 1 100 1

4 100 33


ACQUISTATO

3 volte

PAGINE

42

PESO

330.21 KB

PUBBLICATO

+1 anno fa


DETTAGLI
Esame: Statistica
Corso di laurea: Corso di laurea in scienze politiche e relazioni internazionali (POMEZIA, ROMA)
SSD:
A.A.: 2010-2011

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher AngeloNELLAnebbia di informazioni apprese con la frequenza delle lezioni di Statistica e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università La Sapienza - Uniroma1 o del prof Bartoli Velia.

Acquista con carta o conto PayPal

Scarica il file tutte le volte che vuoi

Paga con un conto PayPal per usufruire della garanzia Soddisfatto o rimborsato

Recensioni
Ti è piaciuto questo appunto? Valutalo!

Altri appunti di Statistica

Indipendenza in media
Dispensa
Indice di Laspeyres e Indice di Paasche
Dispensa
Indipendenza assoluta
Dispensa
Forza Lavoro - Rilevazione ISTAT, Annuario 2010
Dispensa