Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
La media geometrica
La media geometrica di un insieme di n valori x1, x2, … xn (xi > 0) di un carattere quantitativo X è data da:
Se il carattere X è rappresentato mediante una distribuzione di frequenza:
Differenza rispetto alla media aritmetica: la media aritmetica può essere calcolata per qualsiasi valore reale dato un insieme di valori reali. Non è così per la media geometrica, che può essere calcolata solo se ho un insieme di valori strettamente positivi. Infatti, potrebbe risultarmi un numero negativo sotto radice, non possibile da calcolare.
Proprietà della media geometrica.
- La media geometrica gode della proprietà di Cauchy:
- Il prodotto dei valori osservati è uguale al valore medio elevato numero di unità:
Per cui si può quindi dire che la media geometrica lascia invariato il prodotto dei valori osservati.
La media geometrica è sempre inferiore o uguale alla media aritmetica:
TRIMMED MEAN (medie troncate)
La trimmed mean è la media aritmetica calcolata su una fissata percentuale di valori centrali di un insieme di dati, in modo da eliminare l'influenza dei valori anomali.
Ad esempio, nella trimmed mean al 90%, si escludono il 5% dei valori più piccoli e il 5% dei valori più grandi.
Esempio: con valori del carattere (3, 5, 5, 6, 8, 8, 9, 150) la trimmed mean sarà ottenuta escludendo il valore più piccolo e il valore più grande.
7-11/03/20
LA MODA
La moda può essere calcolata per qualsiasi tipo di carattere (qualitativo o quantitativo).
Per caratteri qualitativi e quantitativi con modalità non in classi, la moda (o valore modale) è la modalità prevalente, cioè la modalità a cui corrisponde la frequenza più elevata.
Per caratteri quantitativi con modalità in classi, la moda è la classe (classe modale) a cui corrisponde la densità di frequenza più elevata.
Spesso si considera come moda il valore centrale della classe modale. Esempi: Risposte corrette al test: percentuale più elevata, che è 35, quindi la moda è pari ad 1. Studenti Erasmus: la frequenza assoluta maggiore è 168, quindi la moda è Lingue. Patrimonio delle persone più ricche al mondo: c’è una divisione in classi. Si guarda la densità di frequenza più alta, ossia 347, quindi la moda è la classe 1.0-2.5. 18 Considerazioni sulla moda.
- La moda fornisce informazioni solo su una modalità del carattere, quella prevalente, e ignora le altre;
- La moda dipende solo dalle frequenze;
- La moda acquista validità solo se vi è una netta prevalenza di una modalità rispetto alle altre;
- La moda non esiste se tutte le modalità hanno la medesima frequenza/densità o se queste sono molto simili;
- Esistono distribuzioni bimodali o plurimodali, quando compaiono due o più
LA MEDIANA è la modalità presentata dall'unità centrale in un collettivo ordinato di valori.
Essa divide il collettivo in due sottoinsiemi di uguale numerosità: uno con modalità di ordine più basso e l'altro con modalità di ordine più alto.
Per questo la mediana è definita solo per caratteri quantitativi o qualitativi ordinabili. Se è sconnesso non si può calcolare la mediana, perché per farlo devo ordinare i caratteri in senso non decrescente.
Considerazioni sulla mediana.
- La mediana non è sensibile alla presenza di valori anomali perché considera solo la/le unità centrali. Per questo si dice che la mediana è più robusta della media aritmetica, che invece risente dei valori anomali.
- La mediana rende minima la somma degli scarti considerati in valore assoluto:
basso. Più del 50% dei bambini della sua età sono più alti di lui.
2) Conversione dei voti degli studenti Erasmus: i voti vengono convertiti sulla base della tabella in figura. La tabella mi dice che A è il voto preso dal 10% degli studenti migliori, B dal 25% degli studenti un po’ meno bravi, C è il voto centrale preso dal 30% e via dicendo… Per fare le conversioni vengono presi in considerazione i percentili.
QUARTILI: I percentili di uso più frequente sono il 25-esimo, il 50-esimo e il 75-esimo percentile, detti anche primo (Q1), secondo (Q2) e terzo quartile (Q3) che dividono la distribuzione in quattro parti di uguale numerosità (la mediana corrisponde al secondo quartile, Q2):
- per Q1 si ha p = 0,25
- per Q2 si ha p = 0,50 (è la mediana!)
- per Q3 si ha p = 0,75
3 208 – 12/03/20
VARIABILITÀ ED ASIMMETRIA
VARIABILITÀ
Come gli indici di posizione, anche gli indici di variabilità
Permettono di analizzare in maniera sintetica le caratteristiche più importanti di una distribuzione. La media riesce a rappresentare bene una distribuzione se la maggior parte dei valori si collocano vicino ad essa. La variabilità di una distribuzione, definita solo per caratteri quantitativi, esprime la tendenza delle unità di un collettivo ad assumere modalità del carattere tra loro diverse. Mette in evidenza quanti valori osservati sono mediamente distanti dalla media.
Esempio: Questi studenti hanno dato tutti gli stessi 15 esami. Se si usa la media aritmetica per confrontare queste distribuzioni, non emergono differenze. In realtà si nota che gli studenti non sono uguali: con la variabilità mettiamo in luce questo aspetto. Un indice di variabilità mette in luce la differenza tra i valori osservati. Esso deve soddisfare tre requisiti:
- deve assumere il valore zero se e solo se tutte le unità della distribuzione presentano
stessa unità di misura del carattere: 21
La varianza di una distribuzione di frequenza è pari a:
Se le modalità sono raggruppate in classi si usa il valore centrale di classe cj. 9 – 18/03/20
Proprietà della varianza.
Varianza di una trasformazione lineare.È data da:
Con a, b costanti reali (sostituiscono xi). L’elevamento al quadrato di b si ha perché faccio xi meno la media al quadrato e quindi anche b in questo caso va al quadrato.
“a” scompare perché
Per la deviazione standard vale che: metto sotto radice b quadro var(X)
Uso il modulo perché la radice di b quadro è sia positiva che negativa, ma sotto radice serve un valore positivo.
Coefficiente di variazione.
Osservazione: la varianza e la deviazione standard sono indici assoluti di variabilità perché risentono dell’unità di misura e dell’ordine di grandezza dei dati.
Pertanto, il confronto della variabilità tra
collettivi diversi o caratteri diversi non risulta agevole. Per confrontare la variabilità di due distribuzioni (con media aritmetica > 0) può essere utilizzato il coefficiente di variazione:
Dove x è la media aritmetica. In questo modo riesco a fare il confronto perchè numeratore e denominatore sono espressi nella stessa unità di misura.
Il coefficiente di variazione è un numero puro (non ha unità di misura) e può essere usato per confrontare la variabilità quando:
- i caratteri sono espressi in unità di misura differenti
- i caratteri, pur avendo la medesima unità di misura, sono caratterizzati da intensità medie diverse
Un esempio di confronto di variabilità. Si considerino 9 industrie con dispositivo anti-inquinante di tipo A e 9 di tipo B: per vedere quale è migliore, utilizziamo la quantità di pulviscolo emessa. La distribuzione B presenta una maggior variabilità rispetto
o crescente, il campo di variazione è dato dalla differenza tra il valore massimo e il valore minimo: campo di variazione = valore massimo - valore minimo La deviazione media assoluta. La deviazione media assoluta è data dalla media dei valori assoluti delle differenze tra ciascun valore e la media aritmetica: deviazione media assoluta = (|valore1 - media aritmetica| + |valore2 - media aritmetica| + ... + |valoren - media aritmetica|) / n La varianza. La varianza è data dalla media dei quadrati delle differenze tra ciascun valore e la media aritmetica: varianza = ((valore1 - media aritmetica)^2 + (valore2 - media aritmetica)^2 + ... + (valoren - media aritmetica)^2) / n La deviazione standard. La deviazione standard è la radice quadrata della varianza: deviazione standard = radice quadrata della varianza Questi indici di variabilità sono utili per valutare la dispersione dei dati intorno alla media aritmetica e per comprendere la variabilità dei valori nella distribuzione.