Estratto del documento

Formulario statistica descrittiva

Centralità

Per una distribuzione di frequenze valgono:

  • Q1 = x(m+1)/4 se m è dispari, (xm/4 + x(m/4)+1)1/2 se m è pari. Io quartile (25%)
  • Q2 = Me = x(m+1)/2 se m è dispari, (xm/2 + x(m/2)+1)1/2 se m è pari. IIo quartile (50%)
  • Q3 = x(3m+1)/4 se m è dispari, (x(3/4)m + x(3m/4)+1)1/2 se m è pari. IIIo quartile (75%)
  • Mo = Frequenza più alta (Moda)

Per rappresentare le frequenze utilizzo i grafici a nastri.

M = (1/m) ∑i=1m ni (Media)

Distribuzione di frequenze in classi di modalità

Valgono:

  • Q1 = Ei + (0,25 - Fi) (Es - Ei)/(Fs - Fi)
  • Q2 = Me = Ei + (0,5 - Fi) (Es - Ei)/(Fs - Fi)
  • Q3 = Ei + (0,75 - Fi) (Es - Ei)/(Fs - Fi)
  • M = ∑i=1m ci fi, con ci = (ai + di)/2

Per la moda esisterà una classe modale?

  • Se ai = cost, la classe modale è quella con fi più alta;
  • Se ai ≠ cost, la classe modale è quella con hi più alta.

Trovata la classe modale, il valore della Mo = Ei + Ei/2

Determiniamo hi (densità relativa di frequenza) e Hi (densità assoluta di frequenza):

  • hi = fi/ai, con ai = ampiezza classe
  • Hi = mi/ai

Per rappresentarle graficamente:

  • L'istogramma di frequenze se ai = cost
  • L'ogiva di distribuzione se ai ≠ cost

Se ci chiede la frequenza % di un carattere X con valori esterni o non coincidenti con quelli della classe:

Frequenza % (an ≤ x ≤ as) = [(as - an) · hi] · 100, con an ≠ ai ∧ as ≠ af (va messo hi della classe comprendente [an, as])

Variabilità

  • Δ = Xmax - Xmin (Campo di variazione)
  • DI = Q3 - Q1 (Distanza interquartile)
  • SMe = 1/M ∑i=1M |xi - Me| (Spostamento semplice dalla mediana)
  • SM = 1/M ∑i=1M |xi - M| (Spostamento semplice dalla media)

SMe e SM riutilano: "Mediante le osservazioni si spostano dalla (Me o M) di (valore ottenuto)"

Proprietà: ∑i=1M |xi - Me| ≤ ∑i=1M |xi - c| se e solo se c = Me

È utile per confrontare il valore più alto di due spostamenti

σ(x) = √(1/M ∑i=1M (xi - M(x))²) = √(σ²(x)) (Scarto quadratico medio)

σ²x(x) = 1/mi=1m(ni-M(x))² = 1/mi=1mni² - M²(x) (Varianza)

µ = 1/mi=1mni

Indice di variazione relativo

Se ci chiede un indice di variazione relativo o la variazione di un carattere "X":

CV = σ(x)/|M(x)| (Coefficiente di variazione)

  • (È adimensionale) (CV ÷= CV • 100)
  • Recita: "Mediamente gli spostamenti di 'X' dal valore medio risultano pari a '(CV÷)'!"

Proprietà di linearità

M(x) = cM(y), σ(x) = cσ(y)

CV(x) = CV(y) → Rimane invariato

Distribuzione di frequenza

Sme = 1/mi=1m|ni−Mc|

Sπ = 1/mi=1m|ni−M| (Mc)

σ²= 1/mi=1m(ni−η)² + 1/5∑ni²

= mni−η² = M₂i−M² = M₂i(Mc)−M²

Distribuzione di frequenze in classi di modalità

M ≈ ∑ fi ui

σ² ≈ ∑ π/i fi − Μ² [al posto di πi (scritture pigre) mettiamo CImed]

Indici

  • Base fissa: hit = at / ah
  • Percentuali: hit % = at / ah · 100
  • A base mobile: it = at / at-1
  • Percentuali: it % = at / at-1 · 100

Variazioni

Le prime due formule con i pedici h, t si dividono:

  • Caso Dinamico → h Caso Complessivo → h > t, h = min anno, t = max anno
  • Variazioni ComplessivehVt = (at - ah) / ah = at / ah - 1 = hit - 1
  • hVt % = hVt · 100
  • Variazione Relativat-1Vt = (at - at-1) / at-1 = at / at-1 - 1 = it - 1
  • t-1Vt % = t-1Vt · 100

Proprietà:

  1. <sup>h</sup>t = <sup>v</sup>t + 1 ∧ <sup>i</sup>t = vt + 1 queste due se h=qualcuni emmo=t ma con t>h (Caso Dinamico) con t=men emmo e h=min emmo (Caso Complessivo)
  2. (t-1)it = (t-1)vt + 1 (Caso Relativo)

Se Ho: (t-1)vt e voglio ricavare da esse tit, hit ⇒ tit = (t-1)vt + 1 ∧ hit = i1 i2, i12=a3, i12 a3 a4, ... j1 i2 a3 a4 ... em 2=t 1=t+1

Variazione media

Se \( t > h \) con \( (t-h) \geq 2 \)

Con t = non anno h = min anno

\( \sqrt[\overline{h}]{V_t} = (t-h) \sqrt{t_{h+1} + t_{h+2} + \ldots + t_t} - 1 \)

V\( \sqrt[\overline{h}]{V_t} = (t-h) \sqrt{\frac{a_t}{a_h}} - 1 \)

Variazione Media %

\( \sqrt[\overline{h}]{V_t}% = \overline{V_t} \cdot 100 \)

Reluita; se ogni anno, dal "h" al "t", sifosse verificata una variazione y. Anno.pari (al risultato ottenuto di \( \overline{V_t} \) ) la variazione complessiva dal "h" al "t" sarebbe rimasta invariata.

Concentrazione

Schema:

Anni X Pi Pi Qi Qi
2000 x1 1/1 x1 x1 / TOT
2001 x2 2/2 x1 + x2 x1 + x2 / TOT
2002 x3 3/3 x2 + x2 + x3 x1 + x2 + x3 / TOT

Totale = \(\sum^n_{i=1} x_i\) TOT/TOT = 1

Concentrazione:

  • Equiripartizione R=0, pi - qi = 0
  • Max concentrazione R=1, pi - qi = pi - 0 = pi
  • 0 < R < 0,5 Medio-bassa concentrazione
  • 0,5 < R < 1 Medio-alta concentrazione

Dipendenza in media tra due caratteri (x ∧ y)

Per una distribuzione bivariata in classi di modalità:

  • Trovo M(x) = ∑i=1m ci(x)fi(x)
  • Trovo le medie condizionate H(x | y ∈ [aq1, aq2],..., [ak-1, ak])
  • M(x | y ∈ [aq1, aq2]) = ∑i=1m ci(x)fij(x)
  • M(x | y ∈ [ak-1, ak]) = ∑i=1m ci(x)fij(x)

Se M(x) ≠ M(x | y ∈ [aq1, aq2],..., [ak-1, ak]) c'è dipendenza in media

Per valutare il grado:

  • ηx2 = Ds/Dx
  • D = m ⋅ σ(x)
  • Ds = (M(x | y ∈ [aq1, aq2]) - M(x))2 ⋅ m1(y) + ... + (H(x | y ∈ [ak-1, ak]) - M(x))2 ⋅ mk(y)

Se 0 ≤ ηx2 ≤ 0.5 c'è bassa dipendenza in media di x rispetto ad y.

Se 0.5 ≤ ηx2 ≤ 1 c'è alta dipendenza in media di x rispetto ad y.

ηx2 = 0 indipendenza; ηx = 1 massima dipendenza.

Dipendenza statistica tra 2 caratteri (x × y)

Calcolo 1 sola frequenza teorica → m'ij = mi. ⋅ m.j / N

Se m'ij = mij ∀ i,j, c'è indipendenza e mi posso calcolare le restanti m'ij e costruire una nuova distribuzione con le frequenze teoriche.

Definiamo contingenze → cij = mij - m'ij

Per calcolare l'intensità (o il grado) di dipendenza usiamo il chi-quadro (χ2):

χ2 = ∑i=1rj=1s c2ij / m'ij [Il chi-quadro è un indice assoluto di dipendenza]

χ2 = ∑i=1rj=1s (m2ij / m'ij) - N

χ2 = [∑i=1rj=1s m2ij / (mi. ⋅ m.j) - 1] N

Se ci chiede un indice relativo di dipendenza usiamo il c-quadro:

c2 = χ2 / maxχ2 = χ2 / [ min(r,s) - 1 ] N

0 &leq; C2 &leq; 1

Indipendenza ↑ Massima dipendenza ↑

Tendenza lineare tra 2 caratteri (X e Y)

  1. Calcolo la COV(X,Y) = 1ni=1n(XiYi) - M(X)M(Y)
  2. Per una distribuzione in classi di modalità: COV(X,Y) = 1ni=1nj=1s(Ci(X)Ci(Y)Mij) - M(X)M(Y)
  3. Se COV(Xi,Y) < 0 → Discordanza tra X e Y
  4. Se COV(Xi,Y) = 0 → Nessuna correlazione
  5. Se COV(Xi,Y) > 0 → Concordanza tra X e Y
  6. Per calcolare l'intensità (o grado) di dipendenza: Calcolo il coefficiente di correlazione: r(X,Y) = COV(X,Y) ⁄ √σ2(X).σ2(Y),  -1 ≤ r(X,Y) ≤ 1
  7. Se -1 < r(X,Y) < 0 → C'è discordanza (dipendenza lineare)
  8. Se r(X,Y) = 0 → Nessuna correlazione; nessuna dipendenza
  9. Se 0 < r(X,Y) ≤ 1 → C'è concordanza (dipendenza lineare)
Anteprima
Vedrai una selezione di 4 pagine su 13
Formulario Statistica Descrittiva Pag. 1 Formulario Statistica Descrittiva Pag. 2
Anteprima di 4 pagg. su 13.
Scarica il documento per vederlo tutto.
Formulario Statistica Descrittiva Pag. 6
Anteprima di 4 pagg. su 13.
Scarica il documento per vederlo tutto.
Formulario Statistica Descrittiva Pag. 11
1 su 13
D/illustrazione/soddisfatti o rimborsati
Acquista con carta o PayPal
Scarica i documenti tutte le volte che vuoi
Dettagli
SSD
Scienze economiche e statistiche SECS-S/01 Statistica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher Kijan di informazioni apprese con la frequenza delle lezioni di Statistica e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università della Calabria o del prof Franceschi Sara.
Appunti correlati Invia appunti e guadagna

Domande e risposte

Hai bisogno di aiuto?
Chiedi alla community