Anteprima
Vedrai una selezione di 3 pagine su 8
Indici di diversità e calcolo della concentrazione Pag. 1 Indici di diversità e calcolo della concentrazione Pag. 2
Anteprima di 3 pagg. su 8.
Scarica il documento per vederlo tutto.
Indici di diversità e calcolo della concentrazione Pag. 6
1 su 8
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

INDICI DI DIVERSITÀ

Generalmente gli indici di tipicità vengono affiancati a quelli di diversità che mi diconoquante unità statistiche tendono ad essere diverse tra di loro. Oltre alla modalità ho unindice che mi dice che diversità c’è tra le mie unità statistiche. Assoluti: sono più intuibili ma dipendono dall’unità di misura e dall’ordine medio di grandezza non si presta a fare confronti Relativi: depurati dall’unità di misura e ordine medio di grandezza (mi dice direttamente quanto è mediamente grande quel carattere) adatti a fare confronti con ordine di grandezza alti hanno indici di diversità più alti Caratteri Diversi aspetti della diversità: Eterogeneità Variabilità Differenza tra i due gruppi di indici: i primi sempre costruiti indipendentemente dalla natura del carattere, i secondi invece racchiude un insieme di indici soloper caratteri quantitativi Prima di definire un indice adeguato, posso avere due situazioni: OMOGENEITÀ: Unità omogenee tra di loro, molto simili tra di loro minima eterogeneità;<br>la condizione di omogeneità NON È UNICA ma possono essere diverse. Devo individuare un indice che in caso di omogeneità valga zero. ETEROGENEITÀ: Unità massimamente diverse tra di loro minima omogeneità;<br>il mio indice qua assumerà il valore massimo SITUAZIONE UNICA ma non è detto che sia osservabile, in questo caso lo è perché N è multiplo di k (16 è multiplo di 4, se non lo fosse avrei delle ni con la virgola e quindi non osservabile). Parte dalle unità statistiche e da come si collocano rispetto alle modalità del carattere osservato (la variabilità parte direttamente dalle modalità osservate). Definisce degli indici che misurano come le unità tendono a posizionarsi.

Rispetto alle modalità osservate, la distribuzione di frequenza studia come le unità si distribuiscono rispetto alle modalità osservate di X. Possono esserci 2 situazioni:

Se c'è tendenza ad aggregarsi su 1 o poche unità significa che le modalità saranno simili. Se le unità si equidistribuiscono saranno tendenzialmente più diverse tra di loro, se ne prendo due a caso avranno modalità probabilmente diverse tra di loro.

09.03.22

Due situazioni estreme:

Estrema omogeneità: tutte le N si raggruppano su una stessa modalità del carattere (situazione estrema non unica). Situazione di omogeneità scritta come distribuzione di frequenza dove la N corrisponde ad una sola modalità della x, in tutte le altre righe ho zero; nelle frequenze assolute invece che corrispondenza con N ho 1.

Estrema eterogeneità: le N sono equi ripartite tra le diverse modalità osservate; non è detto che sia osservabile.

in quanto non è detto che N sia multiplo di k (modalità osservate), se ottengo numeri con la virgola la situazione non è osservabile ma è ipotetica. Gli indici di eterogeneità possono essere costruibili su ogni tipo di carattere in quanto mi occupo solo di frequenze assolute o relative. INDICE DI ETEROGENEITÀ DI GINI ASSOLUTI o RELATIVI Indice ASSOLUTO di Gini che si ottiene con: Si usa per calcolare l'allontanamento dei due casi estremi (massima omogeneità e massima eterogeneità); mi serve un indice che cresce man mano che mi avvicino all'eterogeneità e mi allontano dall'omogeneità. Devo capire se l'indice di Gini effettivamente mi serva per calcolare questo. Non è adatto a fare confronti ed è un indice assoluto perché il massimo non è stabilito ma dipende dal valore di k. Massima omogeneità minima eterogeneitàomogeneità → Calcolo questo indice nelle due situazioni estreme: quaderno ARANCIONE l'indice lavora sulle fi quindi:
  1. Calcolo all'inizio il valore della massima eterogeneità (k-1/k) in modo da poter fare dei confronti
  2. Trovo fi al quadrato
  3. Faccio la somma della colonna delle fi al quadrato
  4. Sostituisco alla formula per trovare Eg
  5. Calcolo e controllo se sono più vicino ad una situazione di eterogeneità o di omogeneità (a seconda che il valore trovato sia più vicino a zero (minimo) o alla massima eterogeneità)
Massimo: varia a seconda delle modalità che io ho osservato Minimo: è sempre zero Indice RELATIVO di Gini che si ottiene con: Egr= indice di gini assoluto (trovato in precedenza) moltiplicato per k/k-1 Massima omogeneità: zero Massima eterogeneità: 1 può essere usato per fare confronti → questo I confronti possono essere fatti con l'indice di gini RELATIVO, non assoluto; quando

siconfronta si individua il più eterogeneo tra i dati che ho appena analizzato. Come trovo l’indice relativo per fare confronti:

  1. Costruisco distribuzione di frequenza
  2. Calcolo fi al quadrato e le sommo
  3. Calcolo Eg
  4. Relativizzo e trovo Egr moltiplicando Eg per k/k-1

INDICI DI VARIABILITÀ

Hanno come obiettivo misurare il comportamento del carattere X nel manifestarsi con valori diversi sulle varie u del mio N. Si può valutare solo per caratteri quantitativi, la variabilità parte dalle modalità di x.

CAMPO DI VARIAZIONE: calcola la differenza tra due valori osservati, il più alto e il più basso. È una differenza tra xmax e xmin. Mi da un’idea della variabilità tenendo conto dei due dati estremi osservati. È un indice assoluto che si porta dietro la stessa unità di misura dei miei dati analizzati. Non tiene conto delle u osservate in corrispondenza delle modalità massima e minima.

SCARTO

INTERQUARTILE: tiene conto delle unità che ho osservato più spesso, lavora sulle quantità chiamate quartili specificazioni più dettagliate del concetto di mediana (individua la modalità nel mezzo della successione ordinata, dividendo in 2 gruppi) ma la divisione è in 4 gruppi (ogni gruppo della mediana è diviso ulteriormente a metà) il secondo quartile resta la mediana. La mediana divide già il mio gruppo in due, ogni gruppo va diviso ulteriormente in due in modo da ottenere 4 gruppi (quartili). Q3: terzo quartile Q1: primo quartile Costruire Q1: isolo il primo quarto di osservazioni svolte, 1/4 di osservazioni con le modalità più basse Costruire Q3: isola 1/4 delle osservazioni con le modalità più alte Q3-Q1= taglio fuori le osservazioni estreme se queste si presentano poco (-1/4 di tutte le mie osservazioni); metto dentro nella differenza tra i due valori da considerare quante volte.

Si presentano le modalità estreme, se si presentano poco le taglio fuori 2-0,5=1,5. Mi focalizzo sul 50% di osservazioni nel mezzo, che sono intorno alla mediana, -1/4 le tirovia, + ¼ continuo ad osservarle.

COME CALCOLARE I QUARTILI:

Nelle SUCCESSIONI di DATI:

  1. Ordinare la successione in ordine crescente
  2. Trovare i posti per Q1 e Q3
  3. Calcolare i Q1 e Q3 a seconda che N sia o no multiplo di 4 (vedi regola generale - quaderno)

Nelle DISTRIBUZIONI di FREQUENZA:

  1. Trovare i posti per Q1 e Q3, nello stesso modo della successione di dati
  2. Costruisco distribuzione delle frequenze cumulate Ni (per individuare le modalità corrispondenti ai posti, la prima Ni ≥ o = al posto che ho trovato corrisponde al Q1 o Q3 a seconda di quello che sto cercando)
  3. Calcolo i Q1 e Q3 a seconda che N sia multiplo o no di 4

Nelle DISTRIBUZIONI di FREQUENZA in CLASSI: prevedono già una perdita di informazioni (non so quale modalità precisa ha ogni unità).

È l’unica opzione dove il postodi Q1 o Q3 può avere la virgola, negli altri casi non è possibile.

  1. Trovo il posto per Q1 e Q3 è UNICO (indipendentemente che N sia multiplo o no)Q1 : N/4 Q3 : ¾N
  2. Costruisco distribuzione di frequenze cumulate Ni
  3. Trovo la classe di Q1 e Q3: per individuare le classi di Q1 e Q3 vado nella colonna delle Ni e la prima Ni > o = al posto che ho trovato nel punto 1 corrisponde alla classe, la classe è quella della prima colonna
  4. Trovo Q1 e Q3: immagino le mie u nella classe equamente distribuite al suo interno e calcolo Q1 e Q3 con lo stesso procedimento della mediana nella distribuzione in classe.  Q1 / Q3 = estremo inferiore X (posto trovato nel punto 1 – Ni della classe precedente) / di (di quella classe)

Devianza numero e unità di misura al quadrato valore molto elevato Obiettivo: misurano una diversità tra le mie unità ma essendo di variabilità misura come

I diversi modi di manifestarsi sulle mie CONCENTRAZIONE

La diversità contiene:

  • eterogeneità,
  • variabilità,
  • concentrazione

La concentrazione è un altro aspetto della variabilità e serve per la costruzione degli indici sociali.

Ha come obiettivo analizzare come l'ammontare totale di carattere tende a distribuirsi sulle singole unità statistiche, la variabile è quantitativa in quanto l'ammontare di carattere deve poter essere interpretato (es. l'ammontare totale di carattere delle età non ha un significato particolare, non è osservabile).

L'ammontare totale è sempre costruibile per i quantitativi ma solo in alcuni casi è osservabile, è previsto per quantitativi non negativi, additivi e trasferibili. Caratteri per i quali parte dell'ammontare può essere ceduto o dato da un'unità ad un'altra. (es. l'ammontare totale di reddito ha un significato)

importante in quanto è una quantità che rappresenta la ricchezza di un paese, è quantitativo, non negativo in quanto non si possono avere redditi < 0, additivo (può > o <) e trasferibile (redistribuzione dei redditi).

Concentrazione: costruibile per caratteri:

  • Quantitativi
  • Non negativi
  • Additivi (valore che può essere aumentato o diminuito)
  • Trasferibili (parte dell'ammontare può essere ceduto o ricevuto)

Tutti gli indici di concentrazione si basano sull'individuazione delle due situazioni estreme e si analizza l'avvicinamento del dato trovato a una delle due situazioni:

EQUIDISTRIBUZIONE = minima variabilità: l'ammontare totale di carattere è equi ripartito.

Dettagli
A.A. 2021-2022
8 pagine
SSD Scienze economiche e statistiche SECS-S/01 Statistica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher alessia.alberghini di informazioni apprese con la frequenza delle lezioni di Statistica e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Bologna o del prof Roli Giulia.