Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
Lezione 1
- caratteri qualitativi: non si possono esprimere con dei numeri, possono essere sconnessi o ordinati
- caratteri quantitativi: si esprimono con dei numeri e sono sempre ordinabili
I primi valori che si possono associare a una modalità sono questi:
MODALITA' n = frequenza assoluta ni = frequenza relativa fi = frequenza percentuale associati al modello che... A 474 0,48 48% B 273 0,28 28% C 196 0,20 20% tot: 974 tot: 100%INDICI DI TENDENZA
Moda: modalità a cui corrisponde la frequenza assoluta (n) più alta
Esempio di calcolo della moda per un carattere qualitativo ordinabile
MODALITA' n impossibile 871 possibile 398 prossima 257 tot: 1467Mediana: modalità che comprende gli n1 50%
Esempio semplice: se devo trovare mediana tra 3 2 5 2 4 7 prima ordino i numeri e quindi ottengo 2 3 2 4 5 7. La mediana è 4. Se avessi usato 2 3 4 6 8 9 farei la mediana avrei preso i due numeri centrali (4 e 6) e avrei fatto la media aritmetica (5).
Esempio di calcolo della mediana per un carattere qualitativo ordinabile, 2 modalità:
divido la popolazione totale in due e la mediana corrisponde alla modalità in cui si trova colui che divide in due la popolazione stessa, in questo caso devo vedere dove si trova il 734esimo.
nella modalità "impossibile" vi è la mediana
calcolo F. col F sapremo l'accumulato. Dove è presente già il 50% quella è la mediana, quindi ni
MODALITA' n f F impossibile 871 0,50 0,59 possibile 398 0,27 0,95 prossima 257 0,18 0,32 tot: 1467 tot:Media: (carattere quantitativo)
Media per la distribuzione per unità
μ = ∑i=1c(xi) / n
eta Signor Bianchi 34 Signor Rossi 35 Signor Verdi 57
μ = (34+35+57) / 3 = 38,6
Media per la distribuzione per frequenza
μ = [∑i=1c(xi * ni)] / N = ∑i=1c(xi * fi)
MODALITA':numero di sigarette – fumate al giorno
n f 0 12 0,34 1 19 0,54 2 4 0,11 tot: 35 tot:1μ = (0*0,34)+(1*0,54)+(2*0,11) = 0,76
Questo significa che si fumano 0,76 sigarette per persona, il che equivale a dire che ogni 10 persone si fumano 7 sigarette, ogni 100 persone si fumano 76 sigarette...
Varianza o indice di variabilità & deviazione standard
Varianza per distribuzione per unità
σ2 = [∑i=1c(xi - μ)2] / N
eta Signor Bianchi 34 Signor Rossi 35 Signor Verdi 57
σ2 = [(34-38,6)2 + (35-38,6)2 + (57-38,6)2] / 3 = 21,16 + 12,96 + 338,56 = 124,22
Deviazione standard =
= = 11,14
- varianza per distribuzione per frequenza
MODALITA’:nf0120,341190,54240,11tot: 35tot: 1xx – (x – )(x – ) * f0-0,760,760,5770,1911-0,760,240,0570,0322-0,761,241,530,168tot: sempre 0 0= 0,388
Deviazione standard =
= = 0,62
Quindi mediamente, rispetto alla media, il numero di sigarette fumate può distaccarsi di 0,62.
QUANTILI
- QUANTILI: divido la popolazione in 4 parti, la mediana si trova in corrispondenza del 2° quartile, perché questo si lascia alle spalle il 50% di popolazione.
- range interquartile: intervallo tra, per esempio, 1° e 3° quartile.
- scarto interquartile: per esempio, 3°-1: più questo intervallo è piccolo, più la popolazione è omogenea.
- DECILI: divido la popolazione in 10 parti, la mediana è in corrispondenza del 5° decile.
- PERCENTILI: divido la popolazione in 100 parti, la mediana è il corrispondente del 50° percentile.
Lezione 2
- Coefficiente di variazione mostra quante volte la media sta nella variazione standard
Se voglio analizzare la variabilità di due popolazioni diverse hanno la stessa variazione standard ma diversa media, applico la formula.
TOPOLINI = 150g (media del peso) = 50g C' = 0,33ELEFANTI = 10^ g (media del peso) = 50gC' = 0 (circa)Quindi c’è maggiore variabilità nei topolini, gli elefanti tra loro sono praticamente quasi identici.
DISTRIBUZIONE PER CLASSI con ampiezza uguale
Con la lezione 1 abbiamo visto la distribuzione per unite e la distribuzione per frequenza. Qui si vede la distribuzione per classi.
Punto medio delle singole classiMODALITA’: età di moriri per questi incidentiA iniziaza in questo intervallo, tutti uguale per tuttenfF3025-34103930,120,124035-44105100,150,275045-54104910,140,416055-64104640,140,557065-74104910,150,628075-84103650,110,869085-64106180,191tot: 3307tot: 1Calcoliamo gli indici che conosciamo
- mediana: 55-64
- 1° quartile: la modalità che si lascia alle spalle il 25% di popolazione, cioè 827 persone e quindi 45-54
- 2° quartile: la modalità che si lascia alle spalle il 50% di popolazione, cioè come la mediana e quindi 55-64
- 3° quartile: la modalità che si lascia alle spalle il 75% di popolazione, cioè 2480 persone e quindi 75-84
osservazione: il 1° e 3° quartile sono due classi abbastanza lontane tra loro, quindi c’è una notevole variabilità.
- media: per calcolare la media, avendo delle classi, devo considerare come modalità il punto medio delle singole classi:
=