Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
MediaEs 1: Perdita media di peso (Kg) dopo la dieta misurata su soggetti diversi
3.8, 3.4, 2.9, 4.3, 10.3, 5.4, 4.9
Qual è stato l'effetto medio della dieta?
3.8 3.4 2.9 4.3 10.3 5.4 4.9 35 = = = 5X́ kg
7 7
Interpretazione: se la dieta avesse avuto lo stesso effetto su tutti i soggetti, tutti avrebbero perso 5 kg.
NB: si usa la media solo per caratteri quantitativi!!!
Es 2: Lunghezza supina (cm) in un campione di 60 neonati
51.0 46.5 48.7 54.5 46.0 51.2 55.0 50.2 44.4 56.3 49.4 47.8 50.0 48.2 52.2 51.1 50.2 53.4 49.2 46.5
49.0 49.7 52.9 48.9 47.0 54.7 50.3 47.4 50.4 51.5 52.5 44.5 50.8 51.2 50.8 52.3 47.7 50.5 49.5 50.9
51.5 49.8 46.2 49.5 50.0 48.2 48.5 51.7 52.9 51.6 51.8 53.0 48.9 54.0 52.5 50.8 53.8 49.5 50.5 52.7
Media aritmetica di tutti i 60 valori di lunghezza supina: = (51.0 + 49.4 + ... + 51.6 + 52.7)/60 =X́ 3021.7/60 = 50.361
Interpretazione: il valore 50.361 mi dice che, se tutti i bambini avessero la stessa lunghezza alla nascita, misurerebbero 50.361 cm.
Es 3: numero di
componenti della famiglia…che equivalea… Somma di colonna
Se la variabile continua è raggruppata in classi, nel calcolo dellamedia, prendo il valore centrale di classe.
Per esempio, nella tabella riportata a lato, non conosco esattamente idue valori dell’intervallo 150-154 e assumo che siano entrambi parial valore centrale, ovvero 152. Si procede in modo analogo per tuttele altre classi.
Interpretazione
Il valore 172.9 indica che se tutti i soggetti fossero alti uguali,sarebbero tutti alti 172.9 cm
Media ponderata
Immaginiamo di dover calcolare l’altezza in metri di 85ragazzi di 3 classi diverse.
Come possiamo procedere, in questo caso, per calcolareefficacemente la media globale? Ci si riconduce alconcetto di media ponderata (o media pesata)
Proprietà della media aritmetica 1)1)1)1)1)1)1)1)
La media aritmetica è sempre compresa tra il più piccoloed il più grande dei valori osservati.
2) La somma delle differenze tra i valori e la
frequenzaLa media aritmetica è pari a zero. La media aritmetica può non coincidere con nessuno dei valori osservati nell'insieme di dati in studio. {3.8, 3.4, 2.9, 4.3, 10.3, 5.4, 4.9} 5 Kg non è un valore presente nell'insieme delle osservazioni:
Media: considerazioni finali
La media aritmetica è considerata la migliore e più comune misura di posizione, perché tiene conto dei valori di tutte le osservazioni. Tuttavia, la media può non essere rappresentativa se fra i dati vi sono pochi valori molto distanti dagli altri, verso l'alto o verso il basso.
DISTRIBUZIONE DI FREQUENZA
Analizziamo come appare la distribuzione della frequenza su un generico istogramma. Una distribuzione di frequenza è asimmetrica quando la media aritmetica non coincide con il massimo centrale della curva di frequenza (moda). Viceversa, se la media aritmetica coincide con la moda si tratta di una distribuzione di frequenza simmetrica.
Distribuzione di frequenza
unimodale è caratterizzata da una curva di frequenza con un solo picco. - Distribuzione plurimodale: in una distribuzione plurimodale sono presenti più di una moda al suo interno. La distribuzione plurimodale è caratterizzata da una curva di frequenza con più picchi. Le distribuzioni unimodali e plurimodali possono essere sia simmetriche che asimmetriche. La simmetria o l'asimmetria di una distribuzione dipende dalla posizione e dalla forma dei picchi nella curva di frequenza.sarà per cui caratterizzata da un unico picco.- Distribuzione plurimodale: in una distribuzione plurimodale (o polimodale) esistono due o più mode. Si dice bimodale se ha due valori modali, trimodale se ne ha tre, e così via. Importante è ricordare che una distribuzione può anche non avere moda. In una distribuzione non c'è la moda se nessun valore ha una frequenza superiore agli altri. Distribuzione unimodale Distribuzione bimodale Distribuzione asimmetrica positiva Distribuzione asimmetrica negativa INDICI DI POSIZIONE Ripassino sulla media Ripassiamo ora il concetto di media, già affrontato nella presentazione precedente, attraverso il seguente esempio. Vediamo inoltre perché tale indice può rilevarsi, in certe situazioni, fuorviante. Esempio: Il numero di pazienti vittime di ferite da arma da fuoco registrati negli ospedali in vari paesi nel mondo in un anno è il seguente (indicato come casi ogni 5 milioni di persone): IlNumero medio di morti per paese
Il numero medio di morti per paese è 240/7 = 34,3 per una popolazione di 5 milioni. Tuttavia, il valore 34,3 non rappresenta adeguatamente le osservazioni del mio campione: è maggiore di 6 delle 7 osservazioni effettuate, ed è 5 volte più piccolo dell'osservazione maggiore (USA). Dal momento che la media tiene conto del valore numerico di ogni osservazione del campione, può essere notevolmente distorto da un singolo valore "estremo". In questi casi, una misura robusta della tendenza centrale è la mediana. Vediamo allora di introdurre tale concetto.
La mediana
La mediana è quel valore della variabile tale per cui l'insieme delle osservazioni risulta essere per metà inferiore e per metà superiore ad essa. È dunque il valore che si trova nella posizione centrale della sequenza ordinata. Rispetto alla media aritmetica, la mediana è meno sensibile ai valori estremi delle osservazioni.
Esempio:
I dati seguenti...
Esprimono il peso, in chilogrammi, perso dopo una certa dieta:
La media di 5.49 kg non è un valore tipico dell'insieme di osservazioni, dato che un solo valore su 7 risulta superiore alla media.
Procediamo dunque con il calcolo della mediana:
- Si ordinano le osservazioni:
- Si individua quella modalità che è più grande del 50% delle osservazioni e più piccola del restante 50%.
Prestiamo attenzione a come il valore di 4.3 non dipenda dal valore assunto dall'osservazione più elevata (o più piccola).
Calcolo della mediana
Caso 1
Per n dispari, la mediana è quel valore che occupa la posizione (n+1)/2 nell'insieme ordinato:
Tornando all'esempio precedente si ha che:
(7+1) / 2 = 4° posizione 3.4, 3.8, 4.3, 4.9, 5.4, 13.8 → {2.9,
Caso 2
Per n pari, la mediana è il valore centrale tra quello che occupa la posizione n/2 e [(n/2)+1] nell'insieme ordinato.
Caso 3
Nel caso di lunghe serie di variabili quantitative
discrete si procede identificando la modalità (o la classe) incorrispondenza della quale la frequenza relativa cumulata supera per la prima volta 0,5. Variabile quantitativa discreta: ampiezza del nucleo familiare. La mediana è 3 componenti. Oppure si poteva procedere come per i normali casi visti in precedenza, chiedendoci: "quale modalità occupa la posizione (n+1)/2 = 782/2 = 391 nella serie ordinata?". Identifico la modalità in corrispondenza della quale la frequenza assoluta cumulata supera il valore 391, ovvero 3 componenti. Vediamo ora un altro esempio. Ci si può limitare ad indicare come classe mediana quella 25-29, oppure si può procedere nel modo seguente. Avendo a disposizione tutti i vari dati abbiamo costruito un grafico che rappresentasse l'andamento delle frequenze cumulate relative in funzione delle varie variabili. Abbiamo poi identificato con precisione quella variabile in cui corrispondenza la frequenza cumulata.La relativa assumeva il valore di 0,5. La mediana non risente dei valori estremi o di osservazioni anomale: è detta perciò una statistica robusta.
La moda
La moda di una distribuzione di frequenza è, in statistica, la modalità, il valore o la classe di modalità o di valori, caratterizzata dalla massima frequenza. In altre parole, è il valore che compare più frequentemente. La moda è l'unico indice di posizione che può descrivere variabili qualitative. Può non essere unica, ovvero possono esistere più valori modali (come già detto in precedenza).
Come possiamo distinguere facilmente il tipo di distribuzione?
Ora che abbiamo definito la moda, la mediana e la media, possiamo capire se siamo di fronte a una distribuzione simmetrica o asimmetrica (positiva o negativa), semplicemente confrontando tali indici.
NB
Distribuzione simmetrica
Distribuzione asimmetrica
Concentrazione di cloro nel sudore
Età alla
diagnosi di fibrosi cistica Alcune considerazioni sugli indici di posizioneMedia aritmetica- È la migliore e più comune misura di tendenza centrale perché tiene conto del valore di tutti i dati;
Può- non essere rappresentativa se fra i dati vi sono pochi valori molto lontani dagli altri, verso l'alto o verso il basso;
Interpretazione: se l'età alla diagnosi di fibrosi cistica fosse la stessa per tutti i pazienti, ciascun paziente affetto da fibrosi cistica sarebbe diagnosticato a 9 anni dalla nascita.
Mediana- La mediana non è influenzata dai valori estremi eventualmente presenti, ma solo dal fatto che essi siano sotto o sopra il centro dell'insieme dei dati.
Quando i valori sono molto concentrati in gruppi distinti e separati da grandi intervalli, la mediana può essere di scarsa utilità.
Interpretazione: la metà dei pazienti è diagnosticata all'incirca entro 4 anni dalla nascita, mentre
L'altrametà dopo tale limite. Moda- È il valore tipico dei dati (si presenta più spesso)- Non tiene conto degli altri valori- Interpretazione: la maggior parte dei pazienti è diagnosticata a 3 mesi (0-3 mesi).
*Per quanto riguarda le interpretazioni dei vari indici di posizione svolte sopra, sono riferite all'esempio sulla fibrosi cistica che si può trovare alla pagina precedente.
I quantili (percentili/centili) Oltre alla mediana, che divide a metà un insieme di dati ordinati, importanti sono anche i cosiddetti quantili, utilizzati in statistica per frazionare in N parti uguali un insieme di dati numerici disposti in ordine progressivo crescente (o decrescente). I principali