Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
ESEMPIO.
46 famiglie classificate secondo il reddito annuale percepito da ciascuna di esse.
REDDITO AMPIEZZA
N° FAMIGLIE DENSITÀ
α
−
x x N d
+ i i
i i 1 i
2 – 4 8 2 4
4 – 6 10 2 5
6 – 10 12 4 3
10 – 14 10 4 2,5
14 – 20 6 6 1
46
Si usano le densità di frequenza e non le frequenze assolute per l’altezza dei rettangoli, per
eliminare l’influenza perturbatrice della diversa ampiezza della classe. Se usassimo le frequenze
assolute verrebbe una rappresentazione grafica distorta che non rappresenterebbe effettivamente
l’andamento del fenomeno. Ciò perché la somma delle aree dei singoli rettangoli deve dare la
frequenza assoluta totale. 16
LE MEDIE.
La media è un parametro, ossia un unico valore, che si usa quando si vuol rappresentare una
distribuzione con un unico valore. Dunque è un parametro di sintesi, in quanto sintetizza la
distribuzione e può essere utilizzato sia per caratteri qualitativi che per caratteri quantitativi.
Capita, però, che le distribuzioni risentano di valori estremi. Su 70 persone, tra cui 65 guadagnano
1200, 1400, 1500 ecc, e 5 persone che guadagnano 10 mln di euro, la media verrebbe un valore
altissimo che non rispecchierebbe il reddito medio della maggior parte delle persone. Per cui non
sono opportune da usare le medie di calcolo che risentono dei valori estremi, ma solo le medie di
posizione, altrimenti dette lasche.
Le medie di posizione sono quelle che si ottengono considerando soltanto alcuni valori della
distribuzione.
LA MODA.
La moda è una media di posizione che non risente dei valori estremi, in quanto rappresenta
l’intensità che ha la maggior frequenza nella distribuzione.
Definizione: −
data una variabile statistica, la moda è quel valore interno all’intervallo x x tale che la sua
+
i i 1
〉
frequenza risponda alla seguente disuguaglianza: N N +
i i 1
〉
N N −
i i 1
Quindi la moda è l’intensità o la modalità che ha la frequenza maggiore rispetto alla precedente e
alla successiva. GIUDIZI FREQUENZE
x N
i
i
Insufficiente 2
Sufficiente 3
Buono 2
Ottimo 1
8
Il giudizio modale è “Sufficiente” in quanto ha la frequenza maggiore della precedente e della
successiva. 17
In questo caso siamo di fronte ad una distribuzione bimodale in quanto
x N
i
i abbiamo due valori a rappresentare la moda della distribuzione. L’intensità
1 2 “3” e l’intensità “6”, le quali presentano, appunto, frequenze assolute
2 3 maggiori delle precedenti e delle successive.
3 7
4 6
5 5
6 9
7 5
8 4
Se ci si ritrova a lavorare su un carattere quantitativo continuo, quindi organizzato in classi di
intensità, ci si presentano due casi per calcolare il valore modale:
1. se le classi sono di diversa ampiezza, la moda sarà contenuta nella classe che ha densità di
frequenza maggiore della precedente e della successiva;
2. se le classi sono di uguale ampiezza, la moda sarà interna alla classe che ha frequenza
assoluta maggiore della precedente e della successiva.
REDDITO N d
i i
−
x x +
i i 1
2 – 4 8 4
4 – 6 10 5
6 – 10 12 3
10 – 14 10 2,5
14 – 20 6 1
46
In questo caso la moda è un valore interno alla classe 4 – 6, che prende il nome di classe modale,
perché presenta una densità di frequenza maggiore della precedente e della successiva. 18
LA MEDIANA o VALORE MEDIANO o SECONDO QUARTILE.
Definizione: ordinando le intensità in senso crescente, la mediana è l’intensità che bipartisce la
distribuzione.
Se le intensità sono dispari si ha una sola mediana a bipartire la distribuzione, mentre invece se le
intensità sono pari se ne hanno due. Quindi abbiamo due casi per determinare il posto della
mediana: + 1
N
=
1. Se N è dispari il posto della mediana sarà dato da: ;
P 2
N N
= = +
2. Se N è pari i posti delle mediane saranno dati da: e .
P P 1
1 2
2 2
ESEMPIO 1:
ho nove intensità: 2, 5, -1, 9, 6, 11, 4, -3, 1
Ordino le intensità in ordine crescente: -3, -1, 1, 2, 4, 5, 6, 9, 11
+ +
N 1 9 1
= = =
⇒ , quindi la mediana è
Il posto del valore che bipartisce la distribuzione è: P P 5
2 2
rappresentata dall’intensità “4”.
La moda invece è 0, quindi siamo di fronte ad una distribuzione zero modale, in quanto è a
frequenza unitaria.
ESEMPIO 2:
ho dieci intensità già ordinate in senso crescente: -3, -1, 1, 2, 4, 5, 6, 9, 11, 13
10 10
= = = + =
I posti delle mediane mi sono dati da: e
P 5 P 1 6
1 2
2 2
Quindi ho la mediana rappresentata dai valori “4” e “5”. Vado a calcolare la media tra i due valori:
+
4 5 = e questa, per convenzione, rappresenta la mediana della successione di intensità.
4
,
5
2
I QUARTILI.
Presupponiamo di avere una distribuzione rappresentata da una linea retta:
3 4
1 Q M
≡
2 e
4 2 Q
0 Q 1 3
4 19
I quartili sono tre: 1 4
1. Primo quartile, il quale, partendo da zero, lascia alla sua sinistra dei casi;
2 4
2. La mediana o secondo quartile, partendo da zero, lascia alla sua sinistra dei casi;
3 4
3. Il terzo quartile, partendo da zero, lascia alla sua sinistra i dei casi.
Data una distribuzione ordinata in senso crescente: -3 -1 1 2 4 5 6 9 11.
Si calcola il posto del primo quartile mediante l’equazione: , dove N sta ad indicare il
1
P 9 2,25 3.
Q1 4
numero dei casi della distribuzione; in tal caso Non esistendo il posto 2,25 per
convenzione si arrotonda al posto successivo. Di conseguenza il primo quartile risulta essere
1).
l’intensità 1 (
Per ottenere il posto del terzo quartile utilizzerò l’equazione ; nel nostro esempio
9 6,75 7. 6).
Per cui il terzo quartile risulta essere l’intensità 6 (
Nel caso in cui la distribuzione di frequenze si dispari ma non sia unitaria:
COMPONENTI
FAMIGLIE
1 7 7
2 10 17
3 9 26
4 6 32
5 3 35
35
Vogliamo determinare il primo, il secondo e il terzo quartile. 18,
Il posto della mediana o secondo quartile lo otteniamo in maniera seguente:
in quanto le famiglie, quindi le frequenze, sono di numero dispari.
Per individuare l’intensità che occupa il diciottesimo posto ricorro all’utilizzo delle frequenze
cumulate, altrimenti incorrerei in un percorso lungo, facinoroso e non sempre possibile.
Ad esempio, volendo utilizzare un metodo bizzarro, potrei rappresentare la distribuzione nel
seguente modo:
11111112222222222333333333444444555
In tal modo, contando i posti, arrivo alla conclusione che la mediana è rappresentata dal valore “3”,
che è la prima delle 9 frequenze di detta intensità. Non sempre questo metodo è però utilizzabile, in
quanto si può avere una distribuzione molto più corposa. 20
Mediante le frequenze cumulate, invece, noto subito che la seconda intensità ha frequenza cumulata
17, per cui, dovendo io individuare il diciottesimo posto, mi rendo conto immediatamente che
questo è occupato dalla prima intensità “3” delle 9 riscontrate nella distribuzione.
" 8,75 9.
Il primo quartile è calcolato nella stessa modalità: Il posto 9 ricade nelle
2.
frequenze dell’intensità “2”, quindi 35 26,25 27.
Il posto del terzo quartile lo otteniamo nella medesima maniera: Il
4.
posto 27 ricade nelle frequenze dell’intensità “4”, quindi
Nel caso in cui la distribuzione sia pari avremo:
COMPONENTI
FAMIGLIE
1 7 7
2 10 17
3 9 26
4 6 32
5 2 34
34
Per determinare il posto della mediana agisco nel seguente modo:
17; 2;
$1 18; 3;
# #
Il primo quartile si calcola:
34
1 8,5 9; 2;
4 4
Il terzo quartile sarà:
3 3 102
34 25,5 26; 3;
4 4 4
Qualora le intensità siano espresse in classi avremo:
&
REDDITO
'
2 – 4 8 8
4 – 6 10 18
6 – 10 12 30
10 – 14 10 40
14 – 20 6 46
46 21
Una volta determinata la classe mediana, per calcolare il valore mediano preciso all’interno di essa,
si usufruisce della seguente formula: , - /
( ) $ & .
*
*+ *+
*
Dove:
0
*+ sta ad indicare l’estremo inferiore della classe mediana;
, * sta ad indicare l’ampiezza della classe mediana;
* indica la frequenza assoluta della classe mediana;
è il posto della mediana all’interno della classe;
.
*+ sarebbe la frequenza cumulata precedente alla classe mediana.
Le frequenze sono 46, per cui pari, allora procediamo nel seguente modo:
23; $1 24;
#
I posti 23 e 24 si trovano nella classe che ha frequenza cumulata 30, quindi la classe mediana è 6 –
10.
Dunque avremo:
4 -23
( 6$ & 18/ 7,6
# 12
4 -24
( 6 $ & 28/ 7,8
12
MEDIE DI CALCOLO.
Le medie di calcolo, anch’esse, si utilizzano per rappresentare una distribuzione con un unico
parametro.
Definizione di Cauchy. ) & )
1
La media è qualsiasi valore interno all’intervallo :
) 3 )4 3 )
1
In realtà la media molto raramente coincide con i valori estremi, ma è sempre un valore centrale
rappresentante l’intera distribuzione.
Definizione di Chisini.
La media è quel valore unico che sostituito alle singole intensità lascia immutato il risultato di
alcune operazioni. In pratica la media è invariante rispetto a certe operazioni.
Esempio:
5 10 15 50 Somma: 80 Media: 20
Si nota che la media aritmetica è invariante rispetto alla somma. 22
Media aritmetica.
Se assumo come invariante distributivo la somma delle intensità, la media aritmetica è quell’unico
valore che sostituito a ciascuna intensità lascia invariata la somma delle intensità.
) $ ) $ 5 $ ) 6 $ 6 $ 5$ 6
1
1
7 ) :·6
8
89 ∑ )
189
6 8
:
Media quadratica.
Se assumo come invariante distributivo la somma dei quadrati delle intensità, la media quadratica è
quell’unico valore che sostituito a ciascuna intensità lascia invariata la somma dei quadrati delle
intensità.
) $ ) $ 5 $ ) $ $ 5$
1
1
7 ) :·
8
89 ∑ )
1
= 8
<