Autore: Luigi D'Ambra - Statistica Descrittiva
Capitolo primo: La rilevazione statistica
Ogni ∑ ha un intervallo di i che va da 1 ad n. Oggi il termine statistica è riferito a due significati: un dato numerico o una tavola di dati numerici ottenuto mediante indagini ed elaborazioni; la scienza del collettivo, utilizzato ovunque siano quantificabili i fenomeni di massa.
Carattere: rappresentano gli aspetti delle unità statistiche oggetto di studio.
Modalità: i modi diversi di essere di un carattere con cui si possono presentare le unità di una popolazione. I caratteri si dicono:
- Quantitativi: le modalità sono espresse attraverso una grandezza misurabile o numerabile;
- Qualitativi: se le modalità sono espresse mediante espressioni verbali o attributi.
Sempre per quanto riguarda il carattere, distinguiamo:
- Carattere discreto: quello che ha per modalità i numeri reali 0,1,2,3, etc. (es. gli alunni di una scuola);
- Carattere continuo: quello che ha come modalità tutti i valori compresi in un intervallo (es. altezza, peso).
Le distribuzioni statistiche si distinguono in semplici (se consideriamo un solo carattere) e multiple (se consideriamo due o più caratteri).
Frequenza: il numero delle unità di un carattere che presentano le stesse modalità.
Intensità: è il numero di un carattere che esprime il suo ammontare o la sua misura o la sua grandezza.
Distinguiamo tre tipi di frequenze:
- Frequenza assoluta: il numero delle volte in cui la modalità è stata osservata;
- Frequenza relativa: è il rapporto tra la frequenza assoluta ed il totale delle frequenze;
- Frequenze cumulate: corrispondenti al valore di è la somma delle frequenze assolute, o relative, dalla prima modalità fino a comprendere quella di xi.
Distribuzione statistica: la classificazione delle unità statistiche secondo la modalità di uno o più caratteri e la conseguente tabellazione dei risultati dell’indagine oggetto di studio da luogo alle distribuzioni statistiche. Distinguiamo le distribuzioni statistiche in:
- Distribuzioni semplici: se è riferita ad un unico carattere;
- Distribuzioni in classi: quando i dati sono numerosi conviene procedere ad una suddivisione in classi del carattere cioè la popolazione viene suddivisa in classi distinte;
- Distribuzioni doppie: si hanno quando su ciascuna unità della popolazione si rilevano due caratteri X e Y.
Per le distribuzioni in classi calcoliamo:
- L’ampiezza della classe come la differenza tra il suo estremo superiore e il suo estremo inferiore: hi= xi – x(i-1); oppure w= x(max.) - x(min.) / S;
- La densità di frequenza è il rapporto tra la frequenza e l’ampiezza di una classe: di= ni / hi;
- Il valore centrale di una classe è la semisomma dei suoi estremi: i= xi + x(i-1) / 2;
- Il numero minimo delle classi è dato da: S= 1 + 10/3 log n.
Capitolo secondo: Rapporti statistici
I rapporti statistici vengono elaborati per consentire il confronto tra i dati osservati. In questi rapporti utilizziamo:
- Indici a base fissa: il denominatore scelto è sempre uguale ad una stessa intensità base;
- Indici a base variabile: si confronta ciascun dato con quello precedente, assumendo quest'ultimo volta per volta come base di riferimento.
Numeri indici:
- Numeri indici semplici: rapporti che consentono il confronto tra le intensità di uno stesso fenomeno o più situazioni diverse o in tempi diversi o in luoghi diversi;
- Numeri indici complessi: rapporti che mettono in confronto le intensità di più fenomeni rispetto ad un tempo o luogo base.
Proprietà dei numeri indici semplici:
- Proprietà dell’identità: si pone che il numero indice relativo al periodo di base deve essere uguale ad 1 o ad una potenza di 10; xi = xj -> iij = xj / xi = 1;
- Proprietà della reversibilità delle basi: serve per passare da una serie di numeri indici a base fissa alla corrispondente serie di numeri indici a base mobile ed è sufficiente dividere ciascun numero indice a base fissa per il suo precedente;
- Proprietà transitiva: serve per passare da una serie di numeri indici a base mobile alla corrispondente serie di numeri indice a base fissa, aventi come base fissa il termine iniziale della serie;
- Proprietà della reversibilità dei fattori: l’indice di valore è uguale al prodotto dell’indice dei prezzi e di quello delle quantità, cioè si consideri un dato di valore v suddiviso nei suoi elementi costituenti: v = pq dove p= prezzo e q= quantità;
- Proprietà di commensurabilità: si verifica quando l’indice è indipendente dall’unità di misura delle quantità e non varia se cambia l’ordine di grandezza dell’unità di misura impiegata per esprimere la quantità di beni su cui si commisura il prezzo unitario;
- Proprietà di proporzionalità: un indice non deve annullarsi né tendere ad infinito o diventare indeterminato se si annulla un termine compreso nella formula.
Si possono costituire i seguenti indici dei prezzi:
- Formula di Laspeyre: Ip(L)= ∑p(i1)q(i0) / ∑p(i0)q(i0)
- Formula di Paasche: Ip(P)= ∑p(i1)q(i1) / ∑p(i0)q(i1)
In entrambe le formule i prezzi variano sia al numeratore che al denominatore e le quantità sono costanti, quindi entrambi gli indici sono espressi come rapporti tra medie aritmetiche ponderate dei prezzi degli n beni e/o servizi. Per risolvere il dualismo nella scelta dell’una o dell’altra formula si può procedere ad un’ulteriore sintesi: il criterio proposto da Fisher:
√ ( )Ip(F)= Ip L x Ip(P) √ ( )Iq(F)= (P)Iq L x Iq
Capitolo terzo: Rappresentazioni grafiche
Per rappresentare i fenomeni si utilizzano, come abbiamo già visto, le rappresentazioni tabellari, ora vedremo le rappresentazioni grafiche.
- Diagrammi circolari:
- Diagramma a canne d’organo:
- 3210
- Istogramma:
- Stereogramma:
- 543210 1 2 3 4
- ia ia ia iar r r ro o o oeg teg teg tegtCa Ca Ca Ca
- Box-plot:
Capitolo quarto: Le medie
Gli indici utilizzati sono principalmente 4:
- Indici di posizione (media, mediana, quartili e moda);
- Indici di variabilità;
- Indici di forma;
- Indici di curtosi.
Consideriamo ora gli indici di posizione. Generalmente definiamo la media come quel valore verso il quale convergono tutti i punti. La definizione proposta da Chisini afferma che: sia x1, x2, x3, …, xn la distribuzione per unità di un carattere quantitativo X, una sua media è una quantità che, se sostituita a ciascun termine della distribuzione, lascia inalterato il risultato delle operazioni f eseguite sui termini della distribuzione. In altre parole, se si considera la distribuzione come se fosse una funzione o la media presa n volte quante sono le osservazioni è la stessa cosa.
Abbiamo diverse tipologie di medie:
- La media aritmetica è la media semplice dei termini x1, x2, …, xn e quella ponderata, delle k modalità x1, x2, …, xk di pesi n1, n2, …, nk sono rispettivamente: M= x1 + x2 + … + xn / n
Proprietà della media aritmetica:
- Internalità: la media aritmetica di una serie di valori è sempre compresa tra il valore minimo e il valore massimo, ovvero x1 ≤ M ≥ xn;
- Omogeneità: moltiplicando con una costante c appartenente all’insieme dei numeri reali R i termini di una distribuzione anche la media risulta moltiplicata per la stessa costante c, ovvero (cx1+cx2+…+ cxn)/n = cM;
- Associativa: secondo tale proprietà dividendo un collettivo di numerosità n in c sottogruppi a due a due disgiunti e di numerosità n.1, n.2, …, n.c, dove n=n.1 + n.2 + n.c, la media aritmetica ponderata è uguale alla media ponderata delle medie dei sottogruppi con pesi pari alla frequenza di ogni sottogruppo;
- La somma algebrica degli scarti dei termini della distribuzione della media aritmetica è uguale a zero, ovvero ∑(xi – M)=0;
- La somma dei quadrati degli scarti dei termini della distribuzione dalla media aritmetica è un minimo rispetto alla somma dei quadrati degli scarti dei termini da un qualsiasi altro valore, ovvero ∑ (xi − M)2 = min;
- Consistenza: la media aritmetica è la più usata delle medie;
- La media armonica è il rapporto tra il numero di valori considerati e la somma tra i reciproci dei valori numerici, ovvero: n/(1/x1 + 1/x2 + … + 1/xn);
Proprietà della media armonica:
- Internalità, tale proprietà è valida a patto che i termini della distribuzione siano tutti positivi o tutti negativi;
- Omogeneità, n/(∑ cxi) = cM;
- La somma dei quadrati degli scarti dei reciproci dei valori xi dall’inverso della media armonica è un minimo rispetto alla somma dei quadrati degli scarti dei medesimi valori inversi xi dall’inverso di un qualsiasi altro valore c ≠ Ma, ovvero: ∑ (1/xi − 1/Ma)2 < ∑ (1/xi − 1/c)2;
La media geometrica è la radice n-esima del prodotto dei valori considerati, ovvero: √n(x1 x2 … xk)
Proprietà della media geometrica:
- È nulla la somma degli scarti dei logaritmi dei valori xi > 0 dal logaritmo della media geometrica, ovvero ∑(log xi – log Mg) = 0;
- La somma dei quadrati degli scarti tra i logaritmi dei valori xi ed il logaritmo della media geometrica è un minimo, ovvero ∑ (log xi – log Mg)2 < ∑ (log xi – log c)2;
- Omogeneità, moltiplicando i termini xi per uno stesso numero c appartenente all’insieme dei numeri reali R anche la media geometrica risulta moltiplicata per quel valore c;
- Il reciproco della media geometrica è uguale alla media geometrica dei reciproci dei valori xi, cioè Mg-1(1/x1, 1/x2, …, 1/xk);
- La media geometrica di una serie di rapporti X/Y è uguale al rapporto tra le medie geometriche del numeratore X e del denominatore Y, cioè Mg(X/Y) = Mg(X)/Mg(Y);
- La media geometrica è invariante per una trasformazione di potenza;
- Monotona, se la distribuzione per unità B è più grande della distribuzione A allora: Mg(A) < Mg(B);
- Associativa;
- Consistente;
- Internalità, ma non dipende da quella traslativa;
La media quadratica di ordine h, con h appartenente all’insieme dei numeri reali R di una distribuzione per unità (x1, x2, …, xn), è definita dalla seguente espressione: √h(∑ xih/n).
Le medie troncate si utilizzano quando la media risente troppo dei valori anomali (troppo alti o troppo bassi rispetto al resto della sequenza dei valori) e dunque si considerano solo i valori centrali. Ad esempio, consideriamo i valori 2,15,17,20,40, considerando i valori anomali (2 e 40) la media risulterebbe 18,8 mentre se consideriamo solo i valori centrali (15,17 e 20) essa risulta 17,3 e dunque più attendibile.
Il calcolo della media varia a seconda della distribuzione di cui ci troviamo:
- Serie di dati: ∑ xi/n;
- Tabella di distribuzione semplice: ∑ nixi/n;
- Distribuzione in classi: ∑ nixi/n.
Mediana
È quell’osservazione reale o teorica che separa il 50% che ha intensità inferiore dal 50% che ha...
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.