Tabella di frequenza o matrice dei dati
Modalità / Classe n N f Fi i i i(freq. assoluta) (f. cumulata assol.) (freq. relativa) (f. cumulata relat.) X / [Ck-1, Ck] nk n1 + n2 + ... + nk = N = N fk = nk / N Fk = Nk / N
Istogramma (esclusivamente per caratteri quantitativi continui)
Classe fi (area) di (base) hi (altezza) [Ci-1, Ci] fi Ci - Ci-1 fi / di
Caso 1: Fi x ≤ x < xi+1 carattere quantitativo discreto 1 x ≥ x
Funzione di ripartizione F = F (X ≤ x) ∀ x ∈ Caso 2: Fi-1 + hi * (x - Ci-1) Ci-1 ≤ x < Ci carattere quantitativo continuo 1 x ≥ C
Indici di sintesi
Misure di centralità o posizione
Media aritmetica Dati originali, disaggregati N ∑ x Dati in tabella di frequenza e Ni M = ∑ xi fi = 1... Ni = 1 N Dati con tabelle di frequenza e ∑ xi Nk caratteri in classi M = ∑ xi fi = 1... N* xi = 1* k
Media aritmetica pesata con ωi = peso attribuito a xi
Media quadratica
Media geometrica (prodotto delle variazioni elevato a 1/n° delle variazioni)
Mediana
- Ordina i dati in senso crescente
- Calcola la posizione centrale (N + 1) / 2 Se N è dispari
- Calcola le due posizioni centrali se N è pari
Dati disaggregati per carattere discreto
- Calcola Fi
- Individua Fi che supera per la prima volta 0,5 per carattere discreto
- m = min{x tale che Fi ≥ 0,5}
Dati in tabelle di frequenza per caratteri continui
- Calcola Fi
- Individua la classe mediana, cioè la più piccola [Ci-1, Ci) tale che Fi ≥ 0,5
- Disegna l’istogramma
- Formula generale dove C è l’estremo inferiore della classe mediana, h è la sua densità e F è la sua freq. cumulata
Con frequenze assolute e numeri dispari e pari
- Ordina la modalità in senso crescente
- Calcola la posizione centrale (N + 1) / 2 Se N è dispari
Dati espressi come caratteri qualitativi ordinali
- Ordina i dati in senso crescente
- Calcola la posizione centrale e se i due dati sono uguali si trova una mediana sola, altrimenti si trovano due mediane
Quartili
1° quartile
- Sequenza se numero intero, allora ordinata
- Se non è intero, Q si approssima all’intero più vicino
- Posizione (N + 1) / 4 se il decimale ha un 5, Q è la media dei due valori
2° quartile Q = m
3° quartile
- Se numero intero, allora
- Se non è intero, Q si approssima all’intero più vicino
- Posizione 3 (N + 1) / 4 se il decimale ha un 5, Q è la media dei due valori
Moda Valore o modalità con frequenza (ni) o altezza (hi, in caso di classi) più alta
Misure di variabilità
Range o Campo di variazione R = xN - x1 dove x1 = min{x1, x2, …, xN} e xN = max{x1, x2, …, xN}
Differenza interquartilica o Scarto SIQ = Q3 - Q1
Devianza (misura quanto i dati siano lontani da M) Frequenze assolute e carattere discreto Frequenze assolute e carattere in classi Ci - Ci-1 dove xi = Ci* - Ci-1*
Varianza la varianza può essere = 0 solo se x1 = x2 = … = xN = M
Deviazione standard 0 ≤ δ ≤ 1
Coefficiente di variazione si usa per confronti con unità di misura diverse
Concentrazione
Minima concentrazione x1 = x2 = … = xN = M G = 0 (equidistribuzione)
Massima concentrazione N x1 = x2 = … = xN-1 = 0 e xN = A = 0 G ≈ 1 ∑ xi ni = 1
Indice di Gini
- O