Formulario statistica descrittiva
Centralità
Per una distribuzione di frequenze valgono:
- Q1 = x(m+1)/4 se m è dispari, (xm/4 + x(m/4)+1)1/2 se m è pari. Io quartile (25%)
- Q2 = Me = x(m+1)/2 se m è dispari, (xm/2 + x(m/2)+1)1/2 se m è pari. IIo quartile (50%)
- Q3 = x(3m+1)/4 se m è dispari, (x(3/4)m + x(3m/4)+1)1/2 se m è pari. IIIo quartile (75%)
- Mo = Frequenza più alta (Moda)
Per rappresentare le frequenze utilizzo i grafici a nastri.
M = (1/m) ∑i=1m ni (Media)
Distribuzione di frequenze in classi di modalità
Valgono:
- Q1 = Ei + (0,25 - Fi) (Es - Ei)/(Fs - Fi)
- Q2 = Me = Ei + (0,5 - Fi) (Es - Ei)/(Fs - Fi)
- Q3 = Ei + (0,75 - Fi) (Es - Ei)/(Fs - Fi)
- M = ∑i=1m ci fi, con ci = (ai + di)/2
Per la moda esisterà una classe modale?
- Se ai = cost, la classe modale è quella con fi più alta;
- Se ai ≠ cost, la classe modale è quella con hi più alta.
Trovata la classe modale, il valore della Mo = Ei + Ei/2
Determiniamo hi (densità relativa di frequenza) e Hi (densità assoluta di frequenza):
- hi = fi/ai, con ai = ampiezza classe
- Hi = mi/ai
Per rappresentarle graficamente:
- L'istogramma di frequenze se ai = cost
- L'ogiva di distribuzione se ai ≠ cost
Se ci chiede la frequenza % di un carattere X con valori esterni o non coincidenti con quelli della classe:
Frequenza % (an ≤ x ≤ as) = [(as - an) · hi] · 100, con an ≠ ai ∧ as ≠ af (va messo hi della classe comprendente [an, as])
Variabilità
- Δ = Xmax - Xmin (Campo di variazione)
- DI = Q3 - Q1 (Distanza interquartile)
- SMe = 1/M ∑i=1M |xi - Me| (Spostamento semplice dalla mediana)
- SM = 1/M ∑i=1M |xi - M| (Spostamento semplice dalla media)
SMe e SM riutilano: "Mediante le osservazioni si spostano dalla (Me o M) di (valore ottenuto)"
Proprietà: ∑i=1M |xi - Me| ≤ ∑i=1M |xi - c| se e solo se c = Me
È utile per confrontare il valore più alto di due spostamenti
σ(x) = √(1/M ∑i=1M (xi - M(x))²) = √(σ²(x)) (Scarto quadratico medio)
σ²x(x) = 1/m∑i=1m(ni-M(x))² = 1/m∑i=1mni² - M²(x) (Varianza)
µ = 1/m∑i=1mni
Indice di variazione relativo
Se ci chiede un indice di variazione relativo o la variazione di un carattere "X":
CV = σ(x)/|M(x)| (Coefficiente di variazione)
- (È adimensionale) (CV ÷= CV • 100)
- Recita: "Mediamente gli spostamenti di 'X' dal valore medio risultano pari a '(CV÷)'!"
Proprietà di linearità
M(x) = cM(y), σ(x) = cσ(y)
CV(x) = CV(y) → Rimane invariato
Distribuzione di frequenza
Sme = 1/m∑i=1m|ni−Mc|
Sπ = 1/m∑i=1m|ni−M| (Mc)
σ²= 1/m∑i=1m(ni−η)² + 1/5∑ni²
= mni−η² = M₂i−M² = M₂i(Mc)−M²
Distribuzione di frequenze in classi di modalità
M ≈ ∑ fi ui
σ² ≈ ∑ π/i fi − Μ² [al posto di πi (scritture pigre) mettiamo CImed]
Indici
- Base fissa: hit = at / ah
- Percentuali: hit % = at / ah · 100
- A base mobile: it = at / at-1
- Percentuali: it % = at / at-1 · 100
Variazioni
Le prime due formule con i pedici h, t si dividono:
- Caso Dinamico → h Caso Complessivo → h > t, h = min anno, t = max anno
- Variazioni ComplessivehVt = (at - ah) / ah = at / ah - 1 = hit - 1
- hVt % = hVt · 100
- Variazione Relativat-1Vt = (at - at-1) / at-1 = at / at-1 - 1 = it - 1
- t-1Vt % = t-1Vt · 100
Proprietà:
- <sup>h</sup>t = <sup>v</sup>t + 1 ∧ <sup>i</sup>t = vt + 1 queste due se h=qualcuni emmo=t ma con t>h (Caso Dinamico) con t=men emmo e h=min emmo (Caso Complessivo)
- (t-1)it = (t-1)vt + 1 (Caso Relativo)
Se Ho: (t-1)vt e voglio ricavare da esse tit, hit ⇒ tit = (t-1)vt + 1 ∧ hit = i1 i2, i12=a3, i12 a3 a4, ... j1 i2 a3 a4 ... em 2=t 1=t+1
Variazione media
Se \( t > h \) con \( (t-h) \geq 2 \)
Con t = non anno h = min anno
\( \sqrt[\overline{h}]{V_t} = (t-h) \sqrt{t_{h+1} + t_{h+2} + \ldots + t_t} - 1 \)
V\( \sqrt[\overline{h}]{V_t} = (t-h) \sqrt{\frac{a_t}{a_h}} - 1 \)
Variazione Media %
\( \sqrt[\overline{h}]{V_t}% = \overline{V_t} \cdot 100 \)
Reluita; se ogni anno, dal "h" al "t", sifosse verificata una variazione y. Anno.pari (al risultato ottenuto di \( \overline{V_t} \) ) la variazione complessiva dal "h" al "t" sarebbe rimasta invariata.
Concentrazione
Schema:
| Anni | X | Pi | Pi | Qi | Qi |
|---|---|---|---|---|---|
| 2000 | x1 | 1/1 | x1 | x1 / TOT | |
| 2001 | x2 | 2/2 | x1 + x2 | x1 + x2 / TOT | |
| 2002 | x3 | 3/3 | x2 + x2 + x3 | x1 + x2 + x3 / TOT |
Totale = \(\sum^n_{i=1} x_i\) TOT/TOT = 1
Concentrazione:
- Equiripartizione R=0, pi - qi = 0
- Max concentrazione R=1, pi - qi = pi - 0 = pi
- 0 < R < 0,5 Medio-bassa concentrazione
- 0,5 < R < 1 Medio-alta concentrazione
Dipendenza in media tra due caratteri (x ∧ y)
Per una distribuzione bivariata in classi di modalità:
- Trovo M(x) = ∑i=1m ci(x)fi(x)
- Trovo le medie condizionate H(x | y ∈ [aq1, aq2],..., [ak-1, ak])
- M(x | y ∈ [aq1, aq2]) = ∑i=1m ci(x)fij(x)
- M(x | y ∈ [ak-1, ak]) = ∑i=1m ci(x)fij(x)
Se M(x) ≠ M(x | y ∈ [aq1, aq2],..., [ak-1, ak]) c'è dipendenza in media
Per valutare il grado:
- ηx2 = Ds/Dx
- D = m ⋅ σ(x)
- Ds = (M(x | y ∈ [aq1, aq2]) - M(x))2 ⋅ m1(y) + ... + (H(x | y ∈ [ak-1, ak]) - M(x))2 ⋅ mk(y)
Se 0 ≤ ηx2 ≤ 0.5 c'è bassa dipendenza in media di x rispetto ad y.
Se 0.5 ≤ ηx2 ≤ 1 c'è alta dipendenza in media di x rispetto ad y.
ηx2 = 0 indipendenza; ηx = 1 massima dipendenza.
Dipendenza statistica tra 2 caratteri (x × y)
Calcolo 1 sola frequenza teorica → m'ij = mi. ⋅ m.j / N
Se m'ij = mij ∀ i,j, c'è indipendenza e mi posso calcolare le restanti m'ij e costruire una nuova distribuzione con le frequenze teoriche.
Definiamo contingenze → cij = mij - m'ij
Per calcolare l'intensità (o il grado) di dipendenza usiamo il chi-quadro (χ2):
χ2 = ∑i=1r ∑j=1s c2ij / m'ij [Il chi-quadro è un indice assoluto di dipendenza]
χ2 = ∑i=1r ∑j=1s (m2ij / m'ij) - N
χ2 = [∑i=1r ∑j=1s m2ij / (mi. ⋅ m.j) - 1] N
Se ci chiede un indice relativo di dipendenza usiamo il c-quadro:
c2 = χ2 / maxχ2 = χ2 / [ min(r,s) - 1 ] N
0 ≤ C2 ≤ 1
Indipendenza ↑ Massima dipendenza ↑
Tendenza lineare tra 2 caratteri (X e Y)
- Calcolo la COV(X,Y) = 1⁄n ∑i=1n(XiYi) - M(X)M(Y)
- Per una distribuzione in classi di modalità: COV(X,Y) = 1⁄n ∑i=1n ∑j=1s(Ci(X)Ci(Y)Mij) - M(X)M(Y)
- Se COV(Xi,Y) < 0 → Discordanza tra X e Y
- Se COV(Xi,Y) = 0 → Nessuna correlazione
- Se COV(Xi,Y) > 0 → Concordanza tra X e Y
- Per calcolare l'intensità (o grado) di dipendenza: Calcolo il coefficiente di correlazione: r(X,Y) = COV(X,Y) ⁄ √σ2(X).σ2(Y), -1 ≤ r(X,Y) ≤ 1
- Se -1 < r(X,Y) < 0 → C'è discordanza (dipendenza lineare)
- Se r(X,Y) = 0 → Nessuna correlazione; nessuna dipendenza
- Se 0 < r(X,Y) ≤ 1 → C'è concordanza (dipendenza lineare)