Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
N
1 ∑
x́= x i
N i=1
si fala somma degli individui
- Distribuzione di frequenza:
s
1
Per trovare la media di un carattere diviso in classi si calcola la distribuzione
data dai valori centrali delle classi che sostituiscono le classi. A quel punto si
avrà una distribuzione di frequenza:
t
1 ∑
x́= vc n
i i
N i=1 n
classi n
i i
⊣ +1
x x n 1
i i
⊣
+1 +2
x x n 2
i i
… …
⊣
+t−1 +t
x x nt
i i N
vc
vc n
1 1
vc n
2 2
… …
nt
vct N
Esempi numerici
{ }
1. N= 1,3,3,2,4,5,5,1,8,3 10
+5+5+1+8+
1+3+ 3+2+4 3 1 ∑
=
x́= x i
10 10 i=1
x n
i i
1 2 1∙ 2+2∙ 1+3 ∙3+ 4 ∙ 1+ 5∙ 2+8 ∙ 1
x́=
2 1 10
3 3
4 1 6
1 ∑
5 2 s=6 x́= x n
i i
10
8 1 i=1
solitamente si usa questa seconda scrittura.
10
Proprietà della media aritmetica
Per semplicità le proprietà le vediamo applicate alla distribuzione disaggregata.
1. INTERNALITA’: la media aritmetica è sempre compresa tra la modalità
minima e la modalità massima osservate nelle distribuzioni.
< <
x x́ x
min max
è una proprietà che ne garantisce la rappresentatività.
2. QUANTITA’INVARIATE: la somma delle modalità/osservazioni è pari a
(N volte la media). Definizione della media aritmetica come
N x́
quantità invariante: si intende quella quantità che sostituita ad ogni
osservazione lascia il totale invariato.
3. SCARTI DALLA MEDIA: la somma degli scarti dalla media è nulla.
N
∑ ( )
− =0
x x́
i
i=1
4. CENTRALITA’: la media sta al centro della distribuzione=la somma dei
quadrati degli scarti della media è inferiore o uguale alla somma dei
quadrati degli scarti da qualunque quantità.
N N
∑ ∑ 2
( ) ( )
− −a
x x́ ≤ x
i i
i=1 i=1
a è un qualsiasi elemento dell’asse reale
La media è il punto più vicino alla distribuzione di qualunque altro punto,
se per distanza intendo la somma dei quadrati degli scarti:
N N
∑ ∑
2 2
( ) ( )
− −a
x x́ ≤ x
i i
=1
i=1 i
dove la prima parte è la somma delle distanze dei punti dalla media.
5. EQUIVARIANZA: rispetto alle traslazioni e trasformazioni di scala.
Traslazione di scala: es. abbiamo tre altezze:
1,75 1,78 1,80
traslo l’intera distribuzione di una quantità pari a 3 cm:
1,78 1,81 1,83
Data una distribuzione x ,x …x su N individui, traslarla di un fattore “a”
1 2 n
significa ottenere una distribuzione y ,y …y tale che y è data da a+x
1 2 n i i
con a
Trasformazione di scala:
1,75 1,78 1,80
175 178 180 = trasformo passando da metri a centimetri moltiplicando
per 100, trasformo la scala.
Data una distribuzione x ,x …x ne cambio la scala di un fattore “a” se
1 2 n
moltiplico la scala per “a” ottenendo una nuova distribuzione y ,y …y
1 2 n
tale che y =ax con a.
i i
Data una distribuzione x ,x …x la media exmedia se:
1 2 n
=x +a
y → +a
- ý=x́
i i
=x
y ∙ a → ý=x́ ∙a
- i i
( )
= +b =a
y a∙ x → ý x́+ b
- i i
6. PROPRIETA’ ASSOCIATIVA DELLA MEDIA ARITMETICA: supponiamo di
dividere il nostro collettivo in L gruppi. Che rapporto c’è tra la media del
collettivo e la media dei gruppi. La media generale è data dalla somma
della media dei singoli gruppi moltiplicata per la numerosità dei gruppi e
il tutto diviso la numerosità del collettivo.
L
(1) (1) (L) ( L)
+…
x́ N x́ N 1 ∑ (i) (i )
=
x́= x N
(1) (L) N
+
N …N i=1
Proprietà della mediana
La mediana è quella modalità che una volta ordinate le osservazioni dalla più
piccola alla più grande bipartisce la distribuzione.
x ≤ M ≤ x
1. INTERNALITA’: min e max ( )=a+
=a+ ( )
y b → M y bM x
2. EQUIVARIANZA: i x e e
3. CENTRALITA’: è centrale rispetto alla “distanza di Manhattan”
| | | |
( )
x = +
d x y x y x y questa distanza è
x 2 1 1 2 2 1 1
sempre più lunga della distanza euclidea.
y y
2 | |
In ( ) = −x́
d x , x́ x
1 1
una dimensione | |
( )
= −x́
d x , x́ x
2 2
Consideriamo la somma dei valori assoluti degli
scarti della mediana, essa è degli scarti di una
x x́
1 c, c
qualsiasi altra quantità con
x 2
N N
∑ ∑
| | | | ∈
−M = −c
x x , c R
i e i
i=1 i=1
Differenze tra mediana e media
Concetto di outliers: valori anomali di una distribuzione.
{ }
Es. pesi 72,80,77,72,76,700
Calcoliamo media e mediana:
{ }
Mediana= la mediana è 76
72,75,75,76,77,80,700
Media aritmetica: 165
In questo caso come indice di centralità userei la mediana perché c’è un valore
anomalo che sballa la media aritmetica rendendola così poco significativa. La
mediana non risente della presenza dei valori anomali. Il valore anomale è un
valore che sta sempre agli estremi (valori o troppo piccoli o troppo grandi) e
non hanno effetti sulla mediana che prende il valore che sta al centro; mentre
la media aritmetica inevitabilmente risente di valori anomali perché per essere
calcolata richiede che siano considerate tutte le osservazioni.
Quale indicatore scelgo? A parità di distanza, se ci sono valori anomali, si usa
robusta
come indice di centralità la mediana che è rispetto alla presenza di
valori anomali.
I quantili
I quantili sono indici di posizione (la mediana è un indice di posizione) che non
risento di valori anomali.
- Centili: sono 99 e dividono la distribuzione in 100 parti uguali;
- Decili: sono 9 e dividono la distribuzione in 10 parti uguali;
- Quartini: sono 3 e dividono la distribuzione in 4 parti uguali.
Q =M
2 e
Indici di posizione che si calcolano in base alla
Q Q Q
1 2 3 posizione nella distribuzione di specifiche
osservazioni.
Oltre alla centralità un
aspetto importante della distribuzione è la variabilità.
La variabilità può essere riassunta con una serie di indici; per questi indici si fa
riferimento ai caratteri quantitativi.
Definizione di variabilità: si intende l’attitudine di un carattere quantitativo a
presentarsi con modalità differenti all’interno del collettivo oggetto di studio. Ci
sono una serie di indici per la variabilità ma tutti rispettano le caratteristiche
dall’indice generico di variabilità:
dettate
1. Nullo in caso di assenza di variabilità
2. Deve essere crescente al crescere della variabilità (è una quantità non
negativa).
Per descrivere la variabilità esistono nello specifico 3 categorie di indici:
1. Indici di dispersione: per dispersione si intende la dispersione intorno al
valore della media aritmetica
2. Indici di disuguaglianza: la dispersione non è per forza intorno a un valore
centrale: quest’indice considera tutte le coppie possibili di due elementi,
guarda la discrepanza tra coppie di elementi di una popolazione;
3. Indici di posizione: indici che possono essere calcolati su singoli valori
della distribuzione.
I primi due indici prendono in considerazione tutta la popolazione, l’ultimo no.
Indici di dispersione (rispetto alla media aritmetica)
1. Devianza: la devianza è definita come la somma dei quadrati degli scarti
in modo da eliminare l’influenza del segno. Ci dice come devia la media
della popolazione.
n
∑ 2
( )= (x −x́ )
DEV X i
i=1
Risente della numerosità campionaria quindi la devianza potrebbe essere
molto più alta e non significa che realmente c’è un’alta variabilità; come
depuro l’indicatore dalla numerosità campionaria? Con l’indice della
varianza;
2. Varianza:
N
1 ∑ 2
(x − )
x́
i
N i=1
Anche la varianza però ha qualche problema.
Il suo problema è di non essere espresso nella stessa unità di misura
della distribuzione (l’unità di misura infatti viene elevata ala quadrato);
questo è un problema sia della varianza che della devianza. La soluzione:
considero la radice quadrata di quella quantità che è il terzo indice e
prende il nome di scarto quadratico medio (o deviazione standard).
3. Scarto quadratico medio (o deviazione standard):
√ N
1 ∑ 2
( )= (x − )
σ x x́
i
N i=1
4. Scarto semplice medio: è un indice che sostituisce ai quadrati i valori
assoluti per annullare l’oggetto del segno.
Proprietà della varianza relativa alle trasformazioni lineari di un carattere:
- La varianza rimane invariata sommando una quantità “a”
=x +
y a
i 1 N N
1 1
∑ ∑
2 2 2
( − ) = ( +a−( =¿ ( −x́) =VAR ( )
y ý x x́+ a)) x X
i i i
N N
i=1 i=1
N
1 ∑
( ) = ¿
VAR Y N i=1
=x
y ∙ a
- i 1 X
¿
2 2 2
(x −x́) =a ¿
a VAR
i N
1 ∑
2
(x = ¿
∙ a−( x́ ∙ a))
i N i=1
N N
1 1
∑ ∑
2
( )= ( − ) = ¿
VAR Y y ý
i
N N
i=1 i=1
=a+
y bx
- i 2
( )=b ( )
VAR Y VAR X
Essendo un indice di variabilità dovrebbe rispettare che se le osservazioni
sono tutte uguali allora saranno uguali alla media.
N
1 ∑ 2
2 ( )
( −x́) =¿ =0
x x́− x́
i N i=1
Se x =x …=x =
1 2 n N
1 ∑
( ) = ¿
x́ VAR X N i=1
Proprietà dello scarto quadratico medio (o deviazione standard)
=a
y ∙ x
- i i √
√ √
2 (X )=a (X )=a∙
VAR( X)= a VAR VAR σx
=x +a
y
- i i √ (X )=σx
σy=+ VAR
Indici di disuguaglianza
Dobbiamo considerare tutte le possibili coppie.
Es distribuzione di 3 individui
x x x
1 2 3
2 5 6
Non affronta le osservazioni con la media ma affronta le osservazioni l’una