In questo appunto vengono descritte le medie e lo scarto quadratico medio. Ogni studente sa calcolare la media dei propri voti senza necessariamente aver frequentato un corso di statistica. Indici di posizione centrale ed indici di variabilità della statistica; in questo appunto rivediamo le definizioni e l’utilità di questi parametri. Ogni giorno la stampa ci presenta dati derivati da sondaggi opinioni analisi riguardanti qualsiasi tipo di argomento e numerosi sono anche i grafici che ci vengono proposti.
Quello che noi vediamo è però una sintesi della totalità delle informazioni che si sono rilevate e anche le modalità di raccolta possono essere diverse situazioni. Scopriamo in questo appunto il significato delle medie fisse e lasche e degli indici di variabilità.

Indice
Statistica descrittiva, introduzione
La rappresentazione delle informazioni mediante dei grafici è, nella maggior parte dei casi, di immediata interpretazione e serve a dare una fotografia della situazione così come si presenta al momento. In altri casi, da un grafico si può anche trarre qualche previsione per il futuro.
La statistica è la scienza che si occupa di mettere ordine in una serie di dati al fine di poterne ricavare delle informazioni significative. La statistica descrittiva è usata in molti campi di ricerca: sociologia, fisica, scienze naturali, medicina, meteorologia, economia. Studia i fenomeni collettivi allo scopo di descriverli e interpretarli, fenomeni che sono variabili. Ogni aspetto del fenomeno collettivo che si vuole analizzare si chiama carattere; i diversi modi con cui un carattere si può presentare si chiamano modalità. Le informazioni relative al fenomeno collettivo che si vuole indagare, si ricavano normalmente da un gruppo di persone o un gruppo di oggetti che costituiscono la popolazione oggetto dell’indagine. Ciascun elemento di una popolazione viene detto unità statistica. Alcuni tipi di indagine richiedono il contributo di tutta la popolazione come ad esempio il censimento o lo studio della natalità o della mortalità di una nazione. Per altri tipi di indagine è sufficiente un numero minore e quindi si ricorre ad un sottoinsieme della popolazione stessa che viene definito campione. Ricordiamo che la scelta del campione è una fase molto delicata perché il campione deve essere rappresentativo della popolazione ai fini dello studio del fenomeno collettivo. I caratteri che si analizzano in un’indagine statistica sono essenzialmente di due tipologie caratteri qualitativi e caratteri quantitativi. La differenza sta nel tipo di modalità con cui i caratteri vengono espressi. Per i caratteri qualitativi le modalità si esprimono mediante aggettivi o nomi; in una popolazione di individui sono caratteri qualitativi il colore dei capelli la nazionalità il tipo di professione etc.
Le modalità con cui si esprimono i caratteri quantitativi sono numeri o intervalli di numeri; in una popolazione di individui sono caratteri quantitativi il numero dei figli il numero dei matrimoni contratti, l’altezza, il peso.
I caratteri quantitativi possono ulteriormente essere distinti in caratteri discreti e continui, nei primi le modalità si possono esprimere mediante i numeri naturali cioè dell’insieme N; nei secondi le modalità si possono esprimere mediante intervalli di numeri reali, quindi in R.
Indici di posizione centrale
L’elaborazione dei dati riguarda in generale solo i caratteri di tipo quantitativo, le cui modalità sono espresse da numeri, e consiste in pratica nel calcolo di alcuni particolari indici, detti valori di sintesi, ciascuno dei quali esprime mediante un solo numero, una caratteristica del fenomeno in esame. Questi valori di sintesi vengono chiamati indici di posizione centrale o anche valori medi, perché danno informazioni relative al modo con cui si distribuiscono i dati: sono la medie ferme e le medie lasche. Rientrano nel primo gruppo la media aritmetica, la media geometrica, la media quadratica, la media armonica.
Le medie ferme si possono calcolare solo per caratteri di tipo quantitativo.
Quando i dati sono raggruppati in una tabella di distribuzione di frequenze, si parla di media ponderata o media pesata, perché ciascun dato viene moltiplicato per la sua frequenza assoluta, che indica quante volte quel carattere compare.
Sono definite medie lasche la moda e la mediana. I valori medi hanno lo scopo di sostituirsi in qualche modo ai dati nella loro complessità, le medie lasche servono per mettere in evidenza caratteristiche diverse di una distribuzione.
Medie ferme
La media aritmetica o semplicemente media è uno degli indici maggiormente impiegati dagli statistici .
Si dice media aritmetica M di un insieme n di numeri,
, il rapporto fra la loro somma e il loro numero totale n, in simboli matematici abbiamo:
Questo indice si usa per calcolare un concetto di equa distribuzione; ad esempio: media delle spese, media dei consumi, media delle temperature.
Se la distribuzione è di dati numerici si può anche dire che la media aritmetica è il valore che i dati assumerebbero se fossero tutti uguali fra loro. geometrica semplice
La media geometrica semplice indicata con
, fra n numeri positivi
è la radice n-esima del loro prodotto; in simboli matematici abbiamo:
La media geometrica è il valore che, sostituito a ogni dato, non altera il loro prodotto.
Questo indice viene utilizzato per determinare ad esempio il tasso medio di accrescimento o di diminuzione di un certo fenomeno, e si utilizza anche quando i dati sono in progressione geometrica si può indicare anche semplicemente con G.
La media quadratica fra n numeri è la radice quadrata della media aritmetica dei quadrati dei dati, si indica con
, in simboli abbiamo:
Questo indice viene utilizzato quando ci sono valori che si discostano molto dai valori centrali punto vieni applicata quando si deve eliminare l'influenza dei segni e quando si evidenzia l’esistenza di valori o molto grandi o molto piccoli.
La media armonica semplice e il reciproco della media aritmetica dei reciproci dei dati e si indica con MA, in simboli matematici:
Si usa la media armonica semplice, ad esempio, per trovare il potere medio d’acquisto di una moneta.
Indici di variazione, scarto quadratico medio
Oltre agli indici di posizione per caratterizzare un campione di dati esistono anche gli indici di variazione. Ad esempio, possiamo avere due sequenze di valori con la stessa media ma la distribuzione di questi dati intorno al valore medio può essere differente tra un campione e l'altro; in un campione i dati possono essere più vicini al valor medio, in un altro i dati possono essere più sparsi. In statistica per indicare questo comportamento del campione si dice che le due sequenze hanno una diversa dispersione o variabilità. Lo scarto quadratico medio o deviazione standard è un indice di variailità.
Lo scarto quadratico medio è la media quadratica degli scarti dalla media aritmetica. È indicato con la lettera greca
(sigma), si calcola come segue:
Lo scarto quadratico medio diminuisce quanto più i dati sono prossimi al valore medio. È un indice che serve ad evidenziare l’esistenza di dati che si scostano molto dal valore centrale.
Moda e mediana, medie lasche
La moda e la mediana sono dette anche medie di posizione perché tengono conto solo di alcuni valori della distribuzione.
La moda o valore modale di una distribuzione di frequenza è il termine se esiste, cui corrisponde la massima frequenza nella distribuzione ovvero è il valore che è più presente e si trova in corrispondenza del picco massimo delle frequenze.
Può accadere che una distribuzione abbia più di un termine modale, Se ci sono due valori che presentano la stessa frequenza assoluta, si dice che la distribuzione è bimodale.
Se in una distribuzione ogni modalità ha la stessa frequenza allora la moda non esiste.
Se la distribuzione è per classi si parla di classe modale e la moda è la classe con la frequenza maggiore.
La mediana di una distribuzione è il termine che, disposti i dati in ordine crescente oppure decrescente, occupa il posto centrale. Una volta ordinati I dati del campione, rispetto alla mediana metà delle osservazioni si trova alla sua sinistra l’altra metà alla sua destra.
Per ulteriori approfondimenti sugli indici di variabilità vedi anche qui
Modi per calcolare la mediana
- per la serie, bisogna ordinare i valori in ordine crescente, se i valori sono dispari bisogna prendere il centrale (es. 5 valori si prende il terzo) mentre se i valori sono pari si prende la semisomma dei valori centrali (es. 6 valori si somma il terzo al quarto e si divide per 2);
- per la distribuzione di frequenza con valori discreti, i valori si trovano già in ordine, bisognerà calcolare le frequenze assolute cumulate (la somma verrà indicata con N), a questo punto la mediana è il valore che corrisponde a 1/2 (N+1) se N è dispari, altrimenti alla semisomma tra la metà di N e il numero successivo.
- per la distribuzione di frequenza con dati raggruppati in classi, si determina la classe mediana attraverso le frequenze assolute cumulate, a questo punto occorrerà fare un’interpolazione lineare tra i due valori estremi della classe in cui cade la mediana.