Formulario di statistica descrittiva
A cura di Andrea Alesiani e Gabriele Fabozzi
Frequenze e ampiezze
Frequenza relativa: f = n / k
Frequenza assoluta: f = n
Densità: h = k / A dove A è l'ampiezza della classe
Entropia
Entropia: H = -∑ f ln(f)
Entropia relativa: HREL = H / max(H)
0 ≤ HREL ≤ 1
Media
Valore centrale: Se classe A , Ak-1 ⇒ A
Media aritmetica: x̄ = (∑xi) / n
Media ponderata con frequenze assolute: x̄ = (∑xknk) / n
Media ponderata con frequenze relative: x̄ = (∑xkfk)
Proprietà della media
Somma degli scarti dalla media: ∑(xi - x̄) = 0
Seconda proprietà della media: ∑(xi - a)2 = ∑(xi - x̄)2 + n(x̄ - a)2
Varianza
Varianza (metodo base e metodo semplificato):
σ2 = (∑(xi - x̄)2) / n
σ2 = (∑xk2fk) - x̄2
Trasformazioni lineari
Avendo due variabili y e x tali che y = a + bx:
Se la media di x è x̄, allora la media di y sarà a + bx̄.
Se la varianza di x è σ2, la varianza di y sarà σ2y = b2σ2
Disuguaglianza di Cebicev
Avendo un raggio ε pari a σ, allora:
P(|X̄ - μ| ≥ ε) ≤ 1 / ε2
Distribuzioni bivariate
Condizione d’indipendenza: nhk = nh. * n.k
Indice chi quadrato: χ2 = ∑∑((nhk - nh. n.k)2 / nh. n.k)
0 ≤ χ2 ≤ min[(H-1), (K-1)]