Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
D
. . =
D
Come si nota dalla formula, la deviazione standard è depurata della dipendenza dalla media e di
conseguenza dall’unità di misura (infatti avendo la stessa unità di misura entrambe le variabili può essere
semplificata). Riprendendo l’esempio precedente relativo ai frigoriferi verifichiamo se i coefficienti di
variazione rispettano quanto detto ovvero che, depurando le unità di misura, sono uguali:
&
&
√3,826 f2,44905
() ()
. . = = 0,25 . . = = 0,25
7,7 6,16
Si dimostra quindi che cambiando l’ordine di grandezza (in questo caso uno sconto sul prezzo) il
coefficiente di variazione non ne risente e resta invariato.
Regola di scomposizione della devianza
Consideriamo una distribuzione doppia relativa all’altezza di alcuni individui suddivisi in base alla nazione:
X=altezza\Y=nazione Italia Francia Spagna Totale
160-170 6 1 5 9
170-180 3 3 4 13
180-190 5 6 1 12
Totale 14 10 10 34
176,43 180 171 175,88
dev(x) 771,4 450 440 2093,5
Ricordiamo che la media aritmetica totale può essere ottenuta come media ponderata di quelle parziali.
Calcolando dalle medie parziali le devianze parziali relative ad ogni nazione ci accorgiamo che sommando le
stesse tra loro otterremo un valore minore rispetto alla devianza totale siccome quest’ultima considera gli
scostamenti dei caratteri dalla media generale e non parziale. Come si può risalire da questi valori alla
precisa devianza totale? Utilizziamo la regola di scomposizione della devianza ovvero:
M O O
" "
()
= Q( − ) × = Q l• m + Q( − ) ×
KLK $ D $ N N D N
$2! $2! N2!
Con pari alla numerosità delle righe e pari alla numerosità dei gruppi/colonne. Il primo membro
$ N
dell’addizione finale è chiamato devianza interna ( ) mentre il secondo membro è chiamato devianza
E%K
esterna ( ) quindi . Questi due valori sono pari a:
= +
PQK KLK E%K PQK
• Devianza interna: somma delle devianze parziali dei vari gruppi;
• Devianza esterna: devianza della media parziale di ogni gruppo da quella totale.
Nel nostro esempio la devianza interna è: e la devianza esterna
= 771,4 + 450 + 440 = 1661,4
E%K
" " "
invece: = (176,43 − 175,88) × 14 + (180 − 175,88) × 10 + (171 − 175,88) × 10 = 412,2.
PQK
Dalla loro somma ricaviamo quindi la devianza totale: = 1661,4 + 412,2 = 2093,5.
KLK
Calcolo della varianza e della devianza parziale
Consideriamo la seguente distribuzione in cui ci viene fornita la numerosità dei gruppi, le medie e le
varianze parziali di ogni gruppo (tranne del quarto) e la media e la varianza totale:
1 2 3 4 Totale
4 5 6 20
N 72,5 74 80 77
l• m
N 106,25 104 133,3 148,5
l• m
N
Il nostro obiettivo è calcolare la varianza relativa al quarto gruppo. Per prima cosa possiamo calcolare la
media aritmetica parziale notando che il quarto gruppo è composto da individui. La
20 − 6 + 5 + 4 = 5
media può essere ottenuta, seguendo la proprietà associativa, a partire da quella totale:
(77 (72,5 (74
× 20) − × 4) − × 5) − (80 × 6) 400
= = = 80
* 5 5
Successivamente calcoliamo la devianza totale che, dalla formula, è pari alla varianza totale (a noi nota)
moltiplicata per la numerosità del collettivo: Adesso
= × = 148,5 × 20 = 2970.
KLK KLK
possiamo calcolare la varianza del quarto gruppo attraverso la regola di scomposizione della devianza
(otteniamo la devianza relativa al quarto gruppo e la dividiamo per il numero delle unità):
• : somma delle devianze parziali che si ottengono moltiplicando le varianze per il totale delle
(106,25 (104 (133,3
unità ovvero: ;
= × 4) + × 5) + × 6) + = 1745 +
E%K * *
• : somma degli scarti quadrati tra medie parziali e media totale moltiplicati per n ovvero:
" " " "
(72,5 (74 (80 (80
= − 77) × 4 + − 77) × 5 + − 77) × 6 + − 77) × 5 = 225.
PQK
Dall’unione della devianza interna e quella esterna ricaviamo la seguente equazione:
2970 = 225 + 1745 + ⇒ = 2970 − 225 − 1745 = 1000
* *
Ottenuta la devianza parziale del quarto gruppo la rapportiamo al numero dei componenti
precedentemente individuato (5) e ricaviamo in conclusione la varianza parziale:
1000
= = 200
* 5
Scomposizione della varianza
Anche la varianza, così come la devianza, può essere scomposta in varianza interna e varianza esterna:
= +
KLK E%K PQK
Da cui possiamo definire i due addendi come:
• : media ponderata delle varianze parziali (simile alla proprietà associativa della media);
• : varianza delle medie parziali dalla media generale.
Bisogna ricordare però che, nel caso in cui ci vengano fornite solo le frequenze relative, la varianza interna
sarà pari alla somma dei prodotti tra le varianze parziali e le frequenze relative mentre quella esterna si
otterrà come somma dei prodotti tra gli scarti quadrati (delle medie parziali dalla media generale) e le
frequenze relative (in questo caso la divisione per la numerosità del collettivo è trasportata al numeratore
della frazione e permette la semplificazione).
Calcolo della media e della deviazione standard partendo dal coefficiente di variazione
Consideriamo la seguente distribuzione di 100 aziende per settore produttivo e fatturato medio (media
parziale). Il nostro obiettivo è ricavare la media totale e la deviazione standard da questi dati:
Settore Tessile Alimentare Servizi Totale
Fatturato medio 3,4 4,5 2,6 100
N° aziende 50 20 30
c. v. 0,3 0,8 0,5
La richiesta della media totale è facilmente risolvibile procedendo con la proprietà associativa e quindi
(',*×97))(*,9×"7))(",(×'7) '';
ricavandola come media ponderata delle medie parziali: = = = 3,38.
KLK !77 !77
Successivamente, calcoliamo per ogni settore deviazione standard, varianza e devianza:
• Deviazione standard: si ottiene applicando la formula inversa del coefficiente di variazione ovvero:
da cui e
= . . × = 0,3 × 3,4 = 1,02, = 0,8 × 4,5 = 3,6 = 0,5 × 2,6 = 1,3;
N N N ! " '
• Varianza: per ottenere la varianza è sufficiente, dalla formula inversa, elevare al quadrato le
!" "" '"
" " "
deviazioni standard: e
= 1,02 = 1,0404, = 3,6 = 12,96 = 1,3 = 1,69;
• Devianza: moltiplicando ogni varianza per il corrispettivo totale di unità si ottiene la devianza
relativa a ogni settore: e per il terzo
= 1,0404 × 50 = 52,02, = 12,96 × 20 = 259,9
! "
settore = 1,69 × 30 = 50,7.
'
Dalle devianze parziali posso calcolare la devianza totale come scomposizione in interna ed esterna:
• : somma delle devianze parziali ovvero
= 52,02 + 259,9 + 50,7 = 361,92;
E%K
• : devianza delle medie parziali da quella totale ovvero significa dover calcolare la seguente:
" " "
= (3,4 − 3,38) × 50 + (4,5 − 3,38) × 20 + (2,6 − 3,38) × 30 = 43,36.
PQK
Dalla somma dei due valori ottengo la devianza totale: Il nostro
= 361,92 + 43,36 = 405,28.
KLK
problema richiede il calcolo della deviazione standard che può essere ottenuta come radice quadrata della
varianza totale. La varianza totale è pari alla devianza totale divisa per il totale delle unità:
405,28 &
"
= = 4,0528 = f4,0528 = 2,0132
100
Formula abbreviata di calcolo della devianza
La formula abbreviata di calcolo della devianza deriva dall’analoga formula riferita alla varianza ricordando
che la devianza si ottiene moltiplicando la varianza per il totale del collettivo. Da questo deriva che:
% $" "
() = Q − × ()
$2!
Il primo membro della sottrazione deriva dal fatto che nella formula della varianza, moltiplicando la media
dei quadrati per il totale N si ottiene semplicemente la somma dei quadrati dei caratteri infatti:
# &
∑ D % "
" ) ∑
che moltiplicato per N restituisce
( =
!'% $2! $
%
Calcolo della devianza totale nel caso dell’aggiunta di un’unità
Supponiamo di avere un collettivo di 4 modalità, una devianza totale pari a 14 e un ammontare totale di 20.
Come cambia la devianza totale se si aggiunge una quinta modalità pari a 10? Dividiamo i dati in 2 gruppi:
"7
• Gruppo 1: pari ai quattro valori originali ovvero: e
= 4, = = 5 (| = 4) = 14;
*
• Gruppo 2: pari alla sola aggiunta ovvero: e La media coincide
= 1, = = 10 () = 0.
9
con il carattere in quanto è l’unico dato che costituisce l’ammontare totale e la devianza è 0 proprio
perché non c’è distanza tra la media e il carattere.
Per calcolare la devianza totale calcoliamo prima la media totale pari all’ammontare comprensivo
"7)!7
dell’aggiunta diviso il totale di unità ovvero: Dopodiché, possiamo calcolare la devianza
= = 6.
KLK *)!
totale scomponendola in devianza interna e devianza esterna:
• : somma delle devianze parziali ovvero
= 14 + 0 = 14;
E%K
• : devianza delle medie parziali da quella totale moltiplicate per la numerosità del gruppo
" "
ovvero: = (5 − 6) × 4 + (10 − 6) × 1 = 4 + 16 = 20.
PQK
Da questi due valori procediamo al calcolo finale della devianza totale: = 14 + 20 = 34.
KLK
Altri indici di variabilità (quantitativi)
Oltre agli scostamenti semplici medi e agli scostamenti quadratici medi esistono altri indici tra cui:
• Campo di variazione (range): dove con si indica il valore massimo osservato e con
−
% ! % !
quello minimo. Questo indice ci mostra quanto è ampio il cam