Indici di Tipicità MODA (Mo) Mediana (Me) Media Aritmetica (μ)
Carattere QUALITATIVO Si No No
SCONNESSO Si Si No
Carattere QUALITATIVO
ORDINABILE Si Si Si
Carattere QUANTITATIVO
DISCRETO
Carattere QUANTITATIVO Si Si Si
CONTINUO
Si: indice di tipicità preferibile
Indici di Diversità Indice di
Eterogeneità di Gini Dev/σ^2/σ/CV Concentrazione (R)
(Eg/Egr) No No
Si
Carattere QUALITATIVO Si No
Carattere QUANTITATIVO Si
Carattere QUANTITATIVO NON Si Si
Si
NEGATIVO, ADDITIVO E
TRASFERIBILE
Sì: indice di diversità preferibile
__ : indice di diversità adatto a confronti (—> Relativo)
Indici di associazione
Carattere X^2 σ r
xy / xy
No
Si
Almeno uno QUALITATIVO Si
Si
X e Y Quantitativo
Si: indice di associazione preferibile
__: indice di associazione adatto a confronti (relativo)
Campi di variazione dei vari indici
STATISTICA UNIVARIATA :
Indici di tipicità:
Indici che sintetizzano massimamente ciò che viene osservato e che rappresenti il carattere X osservato sull’intero collettivo.
Medie Lasche
(non pone nel calcolo tutto ciò che viene osservato, non implicando il coinvolgimento diretto di tutte le modalità di X):
Moda (Mo) :
Individua la Modalità di X maggiormente assunta dalle unita statistiche nel collettivo osservato.
Si può avere un caso di distribuzione BI-MODALE nel caso in cui vi siano due mode
Necessita di un dato aggregato
Mediana (Me) :
E la modalità di x che occupa la posizione centrale nella successione ordinata delle osservazioni
E un carattere ROBUSTO rispetto agli Outlayers
Medie Analitiche
(tutte le modalità osservate di X vengono coinvolte nella costruzione dell’indice):
Media Aritmetica (μ) :
E la modalità di X corrispondete alla somma dei valori osservati nel collettivo divisa per la numerosità del collettivo stesso
(Procedimento=Definizione)
Dall’ammontare di carattere la Media lo ripartisce tra tutti trovando un VALORE TIPO che sia rappresentativo della situazione nel suo
complesso
A cause della PROPRIETA’ DELL’INTERNALITA’, la media varia da x(min) <= μ <= x(max) (ovvero dalla modalita osservata piu
Piccola alla modalita osservata piu grande)
Indici di Diversità :
Indicano quanto le unita statistiche sono diverse le une dalle altre rispetto al carattere X osservato
Indici di Eterogeneità
(indica come le unita statistiche tendono ad aggregarsi sulle diverse modalità partendo dal DATO AGGREGATO):
Indice di Eterogeneità di Gini (Εg) :
Misura l’avvicinamento alla situazione di massima Eterogeneità
E sempre positivo e varia da 0 <= Eg <= (K-1)/K :
- Se Eg=0 vi e situazione di OMOGENEITÀ (ovvero tutte le unita statistiche sono omogenee ovvero assumono la stessa
modalita) N imm n(i) f(i) f(i)^2
0 0 0 0
1 0 0 0
2 0 0 0
3 16 1 1
- Se Eg= (K-1)/K vi e situazione di MASSIMA ETEROGENEITÀ (le unita statistiche sono equiripartite tra le modalità del carattere,
si tratta di una situazione ipotetica UNICA ma non è detto che sia osservabile)
N imm n(i) f(i) f(i)^2
0 4 0,25 0,06
1 4 0,25 0,06
2 4 0,25 0,06
3 4 0,25 0,06
Indice di Eterogeneità di Gini Relativo (Egr):
Ideale per eseguire confronti, in quanto si libera della variabile K
E compreso tra: 0<= Egr <= 1:
Egr=0 OMOGENEITA
Egr= 1 MASSIMA ETEROGENEITA
(Le tabelle estreme rimangono le medesime di quelle di Eg)
Indici di Variabilità
(analizza come la modalità del carattere tenda ad avere valori diversi, partendo da Dato DISAGGREGATO):
Campo Di Variazione (C):
Confronta la modalità di due unità statistiche soltanto (la piu alta e la piu bassa)
E un indicatore GREZZO ( ovvero non conta quante volte le modalita si presentano)
E Assoluto in quanto ha una unità di Misura
Scarto Interquartile (SI):
Un quartile divide la successione ordinata in 4 gruppi, e lo scarto interquartile e la differenza tra Q3 e Q1
Permette di togliere delle code che possono essere degli OUTLAYERS
Può coincidere con il campo di variazione
Con gli X quantitativi è possibile costruire il grafico chiamato BOXPLOT:
La posizione della scatola rispetto
al baffo indica come le misurazioni
possono essere sbilanciate (se
verso il basso vuol dire che ci sono piu
Misurazioni basse, se verso l’alto ci sono
più misurazioni alte) e pure la posizione di
Mediana e Scatola indica le medesime
Situazioni
Devianza (Dev):
Misura l’allontanamento delle osservazioni su X dalla media aritmetica
E la somma di tutti gli scarti elevati al quadrato (se non fossero elevati al quadrato la somma sarebbe sempre 0 a causa della
proprietà della media)
Varianza (σ^2):
Misura l’allontanamento delle osservazioni su X dalla media aritmetica
La varianza e definita positiva
A seguito di trasformazioni lineari la varianza risente esclusivamente della costante moltiplicativa elevata al quadrato: σ^2*= b^2σ^2
Varia tra 0 <= σ^2 <= (N-1)μ^2
1. Se σ^2=0 vi è ASSENZA DI VARIABILITÀ (o di diversità), ovvero gli scarti sono uguali a 0 e di conseguenza tutti i valori sono
uguali alla media e tra di loro; esiste una sola situazione di questo tipo.
xi ni
Nella distribuzione di frequenza: x1 0
x2 0
0
x3
x4 (Media) N
Nelle successioni ordinate: x4, x4, x4, x4, ...., x4
2. Se σ^2= (N-1)μ^2 vi è MASSIMA VARIABILITÀ, ovvero una unità possiede tutto l’ammontare totale di carattere e tutti gli altri
non possiedono nulla xi ni
Nelle distribuzioni di frequenza: 0 N-1
(T=Ammontare di carattere) T 1
Totale=T Totale=N
Nelle successioni ordinate: 0, 0, 0, 0, 0, ..., T
Scarto Quadratico Medio (σ):
E anche definito Deviazione Standard, ed è una quantità di scostamento dalla media che riferisce mediamente di quanto si allontano
nel complesso le osservazioni dalla media
Ha la medesima unita di misura della media
Mediamente le Xu sono comprese all’interno dello scarto, ma non il numero delle Xu al suo interno
Varia tra: 0<= σ <= (Le situazioni estreme sono identiche a quelle della variabilita)
Coefficiente di variazione (CV):
E un indice di variabilità relativo che misura l’allontanamento delle osservazioni su X dalla media aritmetica
Non ha L’Unità di misura (è un numero PURO) ed e l’unico modo per confrontare due modalità diverse
Più il coefficiente di variazione è ALTO piu il carattere è variabile
Confrontando i casi limite degli indici di Eterogeneità e di variabilita:
Nel caso in cui Eg=0 anche la Devianza (e la Varianza) saranno NULLE, quindi se vi è OMOGENEITÀ vi e pure ASSENZA DI
VARIABILITÀ
Tuttavia la situazione di massima Eterogeneità NON COINCIDE con la situazione di massima variabilita.
Concentrazione (R):
Raccoglie una serie di misure di DISUGUAGLIANZA e serve per confrontare soggetti rispetto ai loro stati sociali, il car