Estratto del documento

Indici di Tipicità MODA (Mo) Mediana (Me) Media Aritmetica (μ)

Carattere QUALITATIVO Si No No

SCONNESSO Si Si No

Carattere QUALITATIVO

ORDINABILE Si Si Si

Carattere QUANTITATIVO

DISCRETO

Carattere QUANTITATIVO Si Si Si

CONTINUO

Si: indice di tipicità preferibile

Indici di Diversità Indice di

Eterogeneità di Gini Dev/σ^2/σ/CV Concentrazione (R)

(Eg/Egr) No No

Si

Carattere QUALITATIVO Si No

Carattere QUANTITATIVO Si

Carattere QUANTITATIVO NON Si Si

Si

NEGATIVO, ADDITIVO E

TRASFERIBILE

Sì: indice di diversità preferibile

__ : indice di diversità adatto a confronti (—> Relativo)

Indici di associazione

Carattere X^2 σ r

xy / xy

No

Si

Almeno uno QUALITATIVO Si

Si

X e Y Quantitativo

Si: indice di associazione preferibile

__: indice di associazione adatto a confronti (relativo)

Campi di variazione dei vari indici

STATISTICA UNIVARIATA :

Indici di tipicità:

Indici che sintetizzano massimamente ciò che viene osservato e che rappresenti il carattere X osservato sull’intero collettivo.

Medie Lasche

(non pone nel calcolo tutto ciò che viene osservato, non implicando il coinvolgimento diretto di tutte le modalità di X):

Moda (Mo) :

Individua la Modalità di X maggiormente assunta dalle unita statistiche nel collettivo osservato.

Si può avere un caso di distribuzione BI-MODALE nel caso in cui vi siano due mode

Necessita di un dato aggregato

Mediana (Me) :

E la modalità di x che occupa la posizione centrale nella successione ordinata delle osservazioni

E un carattere ROBUSTO rispetto agli Outlayers

Medie Analitiche

(tutte le modalità osservate di X vengono coinvolte nella costruzione dell’indice):

Media Aritmetica (μ) :

E la modalità di X corrispondete alla somma dei valori osservati nel collettivo divisa per la numerosità del collettivo stesso

(Procedimento=Definizione)

Dall’ammontare di carattere la Media lo ripartisce tra tutti trovando un VALORE TIPO che sia rappresentativo della situazione nel suo

complesso

A cause della PROPRIETA’ DELL’INTERNALITA’, la media varia da x(min) <= μ <= x(max) (ovvero dalla modalita osservata piu

Piccola alla modalita osservata piu grande)

Indici di Diversità :

Indicano quanto le unita statistiche sono diverse le une dalle altre rispetto al carattere X osservato

Indici di Eterogeneità

(indica come le unita statistiche tendono ad aggregarsi sulle diverse modalità partendo dal DATO AGGREGATO):

Indice di Eterogeneità di Gini (Εg) :

Misura l’avvicinamento alla situazione di massima Eterogeneità

E sempre positivo e varia da 0 <= Eg <= (K-1)/K :

- Se Eg=0 vi e situazione di OMOGENEITÀ (ovvero tutte le unita statistiche sono omogenee ovvero assumono la stessa

modalita) N imm n(i) f(i) f(i)^2

0 0 0 0

1 0 0 0

2 0 0 0

3 16 1 1

- Se Eg= (K-1)/K vi e situazione di MASSIMA ETEROGENEITÀ (le unita statistiche sono equiripartite tra le modalità del carattere,

si tratta di una situazione ipotetica UNICA ma non è detto che sia osservabile)

N imm n(i) f(i) f(i)^2

0 4 0,25 0,06

1 4 0,25 0,06

2 4 0,25 0,06

3 4 0,25 0,06

Indice di Eterogeneità di Gini Relativo (Egr):

Ideale per eseguire confronti, in quanto si libera della variabile K

E compreso tra: 0<= Egr <= 1:

Egr=0 OMOGENEITA

Egr= 1 MASSIMA ETEROGENEITA

(Le tabelle estreme rimangono le medesime di quelle di Eg)

Indici di Variabilità

(analizza come la modalità del carattere tenda ad avere valori diversi, partendo da Dato DISAGGREGATO):

Campo Di Variazione (C):

Confronta la modalità di due unità statistiche soltanto (la piu alta e la piu bassa)

E un indicatore GREZZO ( ovvero non conta quante volte le modalita si presentano)

E Assoluto in quanto ha una unità di Misura

Scarto Interquartile (SI):

Un quartile divide la successione ordinata in 4 gruppi, e lo scarto interquartile e la differenza tra Q3 e Q1

Permette di togliere delle code che possono essere degli OUTLAYERS

Può coincidere con il campo di variazione

Con gli X quantitativi è possibile costruire il grafico chiamato BOXPLOT:

La posizione della scatola rispetto

al baffo indica come le misurazioni

possono essere sbilanciate (se

verso il basso vuol dire che ci sono piu

Misurazioni basse, se verso l’alto ci sono

più misurazioni alte) e pure la posizione di

Mediana e Scatola indica le medesime

Situazioni

Devianza (Dev):

Misura l’allontanamento delle osservazioni su X dalla media aritmetica

E la somma di tutti gli scarti elevati al quadrato (se non fossero elevati al quadrato la somma sarebbe sempre 0 a causa della

proprietà della media)

Varianza (σ^2):

Misura l’allontanamento delle osservazioni su X dalla media aritmetica

La varianza e definita positiva

A seguito di trasformazioni lineari la varianza risente esclusivamente della costante moltiplicativa elevata al quadrato: σ^2*= b^2σ^2

Varia tra 0 <= σ^2 <= (N-1)μ^2

1. Se σ^2=0 vi è ASSENZA DI VARIABILITÀ (o di diversità), ovvero gli scarti sono uguali a 0 e di conseguenza tutti i valori sono

uguali alla media e tra di loro; esiste una sola situazione di questo tipo.

xi ni

Nella distribuzione di frequenza: x1 0

x2 0

0

x3

x4 (Media) N

Nelle successioni ordinate: x4, x4, x4, x4, ...., x4

2. Se σ^2= (N-1)μ^2 vi è MASSIMA VARIABILITÀ, ovvero una unità possiede tutto l’ammontare totale di carattere e tutti gli altri

non possiedono nulla xi ni

Nelle distribuzioni di frequenza: 0 N-1

(T=Ammontare di carattere) T 1

Totale=T Totale=N

Nelle successioni ordinate: 0, 0, 0, 0, 0, ..., T

Scarto Quadratico Medio (σ):

E anche definito Deviazione Standard, ed è una quantità di scostamento dalla media che riferisce mediamente di quanto si allontano

nel complesso le osservazioni dalla media

Ha la medesima unita di misura della media

Mediamente le Xu sono comprese all’interno dello scarto, ma non il numero delle Xu al suo interno

Varia tra: 0<= σ <= (Le situazioni estreme sono identiche a quelle della variabilita)

Coefficiente di variazione (CV):

E un indice di variabilità relativo che misura l’allontanamento delle osservazioni su X dalla media aritmetica

Non ha L’Unità di misura (è un numero PURO) ed e l’unico modo per confrontare due modalità diverse

Più il coefficiente di variazione è ALTO piu il carattere è variabile

Confrontando i casi limite degli indici di Eterogeneità e di variabilita:

Nel caso in cui Eg=0 anche la Devianza (e la Varianza) saranno NULLE, quindi se vi è OMOGENEITÀ vi e pure ASSENZA DI

VARIABILITÀ

Tuttavia la situazione di massima Eterogeneità NON COINCIDE con la situazione di massima variabilita.

Concentrazione (R):

Raccoglie una serie di misure di DISUGUAGLIANZA e serve per confrontare soggetti rispetto ai loro stati sociali, il car

Anteprima
Vedrai una selezione di 5 pagine su 18
Sintesi Corso di Statistica Pag. 1 Sintesi Corso di Statistica Pag. 2
Anteprima di 5 pagg. su 18.
Scarica il documento per vederlo tutto.
Sintesi Corso di Statistica Pag. 6
Anteprima di 5 pagg. su 18.
Scarica il documento per vederlo tutto.
Sintesi Corso di Statistica Pag. 11
Anteprima di 5 pagg. su 18.
Scarica il documento per vederlo tutto.
Sintesi Corso di Statistica Pag. 16
1 su 18
D/illustrazione/soddisfatti o rimborsati
Acquista con carta o PayPal
Scarica i documenti tutte le volte che vuoi
Dettagli
SSD
Scienze economiche e statistiche SECS-S/01 Statistica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher El-diez di informazioni apprese con la frequenza delle lezioni di Statistica e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Bologna o del prof Roli Giulia.
Appunti correlati Invia appunti e guadagna

Domande e risposte

Hai bisogno di aiuto?
Chiedi alla community