Lezione 1: Caratteri qualitativi e quantitativi
Caratteri qualitativi
I caratteri qualitativi non si possono esprimere con dei numeri e possono essere sconnessi o ordinali.
Caratteri quantitativi
I caratteri quantitativi si esprimono con dei numeri e sono sempre ordinali.
Modalità
I primi valori che si possono associare a una modalità sono questi:
- n = frequenza assoluta, numero di soggetti associati alla modalità
- f = frequenza relativa (es. 474/974)
- f % = frequenza percentuale
| Modalità | n | f | f % |
|---|---|---|---|
| A | 474 | 0,4848 | 48% |
| B | 277 | 0,2828 | 28% |
| C | 196 | 0,2020 | 20% |
| Totale | 974 | 1 | 100% |
Indici di tendenza
Moda
La moda è la modalità a cui corrisponde la frequenza assoluta (n) più alta.
Esempio di calcolo della moda per un carattere qualitativo ordinabile:
| Modalità | n |
|---|---|
| Impossibile | 871 |
| Possibile | 339 |
| Prossima | 257 |
| Totale | 1467 |
Mediana
La mediana è la modalità che comprende il 50%.
Esempio semplice: se devo trovare mediana tra 3, 5, 2, 4, 7 prima ordino i numeri e quindi ottengo 2, 3, 4, 5, 7. La mediana è 4. Se avessi avuto 2, 3, 4, 6, 8, 9, per fare la mediana avrei preso i due numeri centrali (4 e 6) e avrei fatto la media tra loro, ottenendo 5.
Esempio di calcolo di mediana per un carattere qualitativo ordinabile con due modalità:
Divido la popolazione tale che la mediana corrisponde alla modalità in cui si trova colui che divide a metà la mia popolazione. In questo caso devo vedere dove si trova il 734esimo, ovvero il primo tra 871, e quindi la mediana è "impossibile".
Calcolo F, cioè la sequenza cumulata. Dove F rappresenta già il 50%, quella è la mediana, quindi in questo caso è "impossibile".
| Modalità | n | F | f % |
|---|---|---|---|
| Impossibile | 871 | 0,5959 | 59% |
| Possibile | 339 | 0,2323 | 23% |
| Prossima | 257 | 0,1823 | 18% |
| Totale | 1467 | 1 |
Media
Per il carattere quantitativo si calcola la media.
Esempio di media per la distribuzione per unità:
- Signor Bianchi: 34
- Signor Rossi: 35
- Signor Verdi: 57
Calcolo: (34 + 35 + 57) / 3 = 38,6
Media per la distribuzione per frequenza:
| Modalità | n | f | Numero di sigarette fumate al giorno |
|---|---|---|---|
| 0 | 12 | 0,34 | |
| 1 | 19 | 0,54 | |
| 2 | 4 | 0,11 | |
| Totale | 35 | 1 |
Calcolo: (0 * 0,34) + (1 * 0,54) + (2 * 0,11) = 0,76
Questo significa che si fumano 0,76 sigarette per persona. In altre parole, ogni 10 persone si fumano 7,6 sigarette, ogni 100 persone se ne fumano 76.
Varianza o indice di variabilità & deviazione standard
Varianza per distribuzione per unità:
- Signor Bianchi: 34
- Signor Rossi: 35
- Signor Verdi: 57
Calcolo: ((34 - 38,6)2 + (35 - 38,6)2 + (57 - 38,6)2) / 3 = 211,16 + 12,96 + 338,56 / 3 = 124,22
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.