Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
K
1 ∑ ᶍᶇ
x́=
possiamo calcolare più velocemente la media aritmetica: oppure
n j=1
K
∑ ᶍᶂ ᶇ
x́= dove K è il numero di modalità assunte dal carattere, è la frequenza
j=1 ᶂ
assoluta della j-esima modalità e è la corrispondente frequenza relativa. Queste
ultime formule non possono essere utilizzate se il carattere quantitativo X è suddiviso
in classi. Un’approssimazione della media aritmetica può comunque essere ottenuta
considerando al posto della classe il suo valore centrale, ossia il valore che si ottiene
come semisomma degli estremi della classe. Si può approssimare la media aritmetica
K
1 ∑
x́= cjᶇ
del carattere con l’espressione dove K è il numero di classi nella
n j=1 ᶇ
distribuzione di frequenze, c è il valore centrale e è la frequenza assoluta. Tale
j
operazione porta ad un calcolo esatto della media se ogni valore centrale coincide con
la media dei valori interni alla medesima classe.
ESEMPIO
Un'automobile percorre 225 km, i primi 120 a 60 km/h, i restanti 105 a 105 km/h. Qual
è la velocità media? Possiamo considerare che l'automobile ha percorso i 225 km in un
tempo di 3 ore, per cui la velocità media
è 225/3=75 km/h. Il conto che abbiamo fatto è il seguente: (120/60 + 105/105)/
(120+105). Si tratta di una media armonica pesata, in cui abbiamo valutato la velocità
come spazio/tempo di percorrenza.
Se invece, nella stessa situazione ci interessassero i consumi e si avesse ad esempio
che l'auto consumi 7 lt /100 km quando viaggia a 60 km/h e 8.5 lt/100km quando
viaggia a 105 km/h, avremmo un consumo medio di carburante pari a
(7*120+9*105)/225=8.089 lt/km ossia un consumo medio di circa 8 litri per km. Si noti
che questa è una media aritmetica pesata.
In alcuni casi, nel calcolo della media aritmetica alle diverse osservazioni viene
attributo un peso, ossia un valore che ne esalti o ne diminuisca l’importanza. Si
introduce allora la media aritmetica ponderata. 9
La media aritmetica ponderata di un insieme di n valori osservati x₁,x₂,…,x di un
n
carattere quantitativo X con pesi p₁,p₂,…,p non negativi, è data da:
n
n
∑ ᵢ ᵢ
x p
₁ ₁+ ₂ ₂+
x p x p …+ xnpn i=1
=
x́ a= ₁+ ₂+…+ n
p p pn ∑ pᵢ
i=1
Proprietà della media
1. la somma dei valori x₁,x₂,..,x assunti da un insieme di n unità statistiche è
n n
∑ xᵢ=n x́ a
uguale al valore medio moltiplicato per il numero di unità: i=1 x́ a
2. la somma delle differenze tra i valori della xᵢ e la loro media aritmetica è
n
∑ ( ) =0
xᵢ− x́ a
pari a zero: i=1
3. la somma degli scarti al quadrato dei valori xᵢ da una costante c è minima
n
∑ 2
( ) x́ a
xᵢ−c
quando c è uguale alla media aritmetica: è minimo per c=
i=1
4. se un collettivo di n unità statistiche viene suddiviso in L sottoinsiemi disgiunti
L
∑ nh=n
di numerosità n₁,n₂,.., n tali che con media rispettivamente
L h=1
( ) ( )
x́ a 1 , x́ a 2 , … , x́ a( L) x́ a
allora la media aritmetica generale si può
ottenere come media ponderata delle medie dei sottoinsimi con pesi uguali alle
L
1 ∑ n
x́ a= x́ a(h)
loro numerosità: h
n h=1
5. la media aritmetica di un carattere Y, ottenuto attraverso un carattere lineare
x́ a ý a=α x́ a+ β
Y=αX+β di un carattere X di media è uguale a:
La media geometrica
La media geometrica è una media analitica utilizzata nel caso in cui l’insieme dei dati
è costituito da valori positivi generati da rapporti. La media geometrica di un insieme
di n valori positivi x₁,x₂,..,x di un carattere quantitativo X è pari alla radice n-esima del
n √
n
prodotto dei singoli valori: ₁∗x ₂…
x́ g= x xn
Anche per la media geometrica vi è una formulazione più sintetica se si dispone della
√
n n 1 n 2 nk
∗x ∗…∗x
distribuzione di frequenze del carattere X: oppure
x́ g= x 1 2 K
f 1 f 2 fk ᶇ
∗x ∗… dove K è la modalità assunta dal carattere, è la frequenza
x́ g=x x
1 2 K ᶂ
assoluta della j-esima modalità e è la corrispondente frequenza relativa.
ESEMPIO Tipico l'esempio dei tassi di variazione annui, in cui la variazione complessiva
del valore dal tempo iniziale a quello finale si ottiene moltiplicando successivamente i
tassi annuali.
Proprietà della media geometrica
1. il prodotto dei valori x₁,x₂,..,x assunti da un insieme di unità statistiche è uguale
n x́ g
alla potenza n-esima della media geometrica: x₁*x₂*..x = [
n n
¿ ¿
2. il logaritmo della media geometrica è uguale alla media aritmetica dei logaritmi:
n
1 ∑ )
log x́ g= log(xᵢ
n i=1
La trimmed mean
La media aritmetica è un valore caratteristico intorno al quale si posizionano i valori
della distribuzione. Tuttavia il maggior difetto della media aritmetica è che essa risente
10
fortemente dei valori estremi, cosicché può accadere che il suo valore non sia ben
rappresentativo dell’insieme dei valori osservati. Un modo che consente di diminuire
l’effetto dei valori estremi nol calcolo della media è quello di effettuare il calcolo solo
sui valori centrali. La media così ottenuta viene detta trimmed mean. La trimmed
mean al 50% di un carattere quantitativo è la media aritmetica del 50% dei valori più
centrali di un insieme di osservazioni. In pratica nel calcolo della media aritmetica non
vengono considerati il 25% dei valori più piccoli e il 25% dei valori più grandi.
ESEMPIO Otto valori: 3,5,5,6,8,8,9,150 la media aritmetica è 24,25; per calcolare la
trimmed mean al 50% si escludono i due valori più piccoli e i due valori più grandi,
ossia: 5+6+8+8/4= 6,75
La trimmed mean può essere calcolata anche in riferimento a percentuali diverse dal
50%. Più grande è la percentuale e minore è il numero di valori estremi da escludere.
La mediana
Una media più robusta della media aritmetica, cioè meno sensibile hai valori estremi,
è la mediana. Questa può essere calcolata solo se il carattere è almeno ordinabile,
cioè deve essere possibile ordinare in modo crescente o decrescente le modalità del
carattere. M
La mediana, indicata con , di un insieme di unità ordinate, è la modalità
e
presentata dall’unità centrale, dove per ogni unità centrale si intende quell’unità che
divide il collettivo in due parti di uguale numerosità: una parte formata dalle unità che
presentano una modalità precedente o uguale a quella dell’unità centrale e una parte
formata dalle unità che presentano una modalità successiva o uguale a quella
dell’unità centrale.
Per calcolare la mediana occorre:
1. ordinare le n uità in senso crescente rispetto alle modalità del carattere;
2. individuare la posizione in graduatoria dell’unità centrale; se n è dispari, la
(n+1) n
posizione è ; se n è pari si hanno due unità centrali con posizione 2
2
( )
n +1
e ;
2
3. osservare la modalità presentata dall’unità centrale: se n è dispari la mediana
=x
M ; se n è pari abbiamo due modalità corrispondenti alle due unità
(n+1)
e 2 +1
x
x
centrali: e ; quando le unità del collettivo sono numerose, accade
( )
n n
2 2
che le due modalità coincidono, cosicché anche in questo caso la mediana è
identificata da una sola modalità. In ogni caso, se il carattere è quantitativo,
possiamo considerare come mediana la semisomma dei valori delle due unità
1 ( )
= +
M x x
centrali: e n n
2 +1
2 2
Se abbiamo un carattere qualitativo e la corrispondente distribuzione di frequenze, per
calcolare la mediana occorre anche qui determinare l’unità centrale o le unità centrali.
Quando i dati vengono presentati mediante una dstribuzione di frequenze di un
carattere quantitativo suddiviso in classi non è possibile individuare esattamente la
mediana. In questo caso è possibile ottenere una sua approssimazione attraverso la
( )
0,5−F m−1
+
M ≈ I ∆
formula: dove:
e m m
−F
F −1
m m
I è l’estremo inferiore della classe modale (la classe che contiene l’unità centrale);
m
F è la frequenza relativa cumulata fino alla classe precedente a quella mediana;
−1
m
F è la frequenza relativa cumulata fino alla classe mediana;
m
D o ∆ è l’ampiezza della classe mediana.
m m 11
Per applicare l’ultima formula scritta bisogna innanzitutto calcolare la distribuzione
delle frequenze relative cumulate e poi l’ampiezza della classe mediana.
Proprietà della mediana
Per un carattere quantitativo X, la somma degli scarti in valore assoluto dei valori xᵢ da
n
∑ | |
−c
xᵢ
una costante c è minima quando c è uguale alla mediana: è minimo per
i=1
M
c= e
La mediana è più robusta della media. Media e mediana a confronto: La media e la
mediana di una distribuzione simmetrica sono molto vicine. Se la distribuzione è
esattamente simmetrica media e
mediana coincidono. In una distribuzione asimmetrica, la media si trova più all’esterno
(sulla coda lunga della distribuzione) rispetto alla mediana.
La moda
La moda è una media di posizione che può essere calcolata per qualsiasi tipo di
carattere. Essa è la modalità della distribuzione che si presenta con la massima
frequenza (assoluta,relativa o percentuale).
Se la distribuzione è costituita da pochi termini è abbastanza probabile che si verifichi
uno dei casi seguenti:
1. tutte le modalità si presentano con frequenza pari a 1; in tal caso la moda non
esiste (è indeterminata)
2. due o più modalità si possono presentare con la medesima frequenza massima;
in tal caso la distribuzione si dice plurimodale.
La moda è di nuovo indeterminata nel caso di distribuzione in classi. Per le
distribuzioni in classi si determina la classe modale. La classe modale non
n