Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
FORMULARIO
STATISTICA DESCRITTIVA
- frequenza relativa: fj = mj/n
- frequenza percentuale: pj = fj 100
- frequenza assoluta: nj = fj n
- frequenze cumulate assolute: Nj
- frequenze cumulate relative: Fj = Nj/n
densità: frequenza è quella frequenza che si avrebbe se le classi avessero tutte la stessa ampiezza.
ampiezza: estremo superiore meno estremo inferiore
hi = fi/ai
hc = pi/ai
MEDIA ARITMETICA PER DISTRIBUZIONI DI DATI
x̄ = (x1 + x2 + ... + xn)/n
x̄ = (1/n) Σ xi
x̄ = (1/ni) Σ xi
MEDIA ARITMETICA PER LE DISTRIBUZIONI DI FREQUENZA
x̄ = (1/n) Σxifi
x̄ = (1/ni) Σ xifi
MEDIA ARITMETICA DI UN CARATTERE SUBDIVISO IN CLASSI
x̄ = (1/n̄) Σ (nj/ai)
Media aritmetica ponderata
x̄ = Σi xi pi / Σi pi ∙ poi
Proprietà della sommatoria
- a) Σi=1k c = kc
- b) Σi=1k cai = c Σi=1k ai
- c) Σi=1k (ai + bi) = Σi=1k ai + Σi=1k bi
- d) Σi=1k ai / bi = a1 / b1 + a2 / b2 + ... + ak / bk
- e) Σi=1k aibi = a1b1 + a2b2 + ... + akbk
Proprietà della media aritmetica
- a) x̄ = Σi=1n xi / n
- b) Σi=1n (xi − x̄ ) = 0
- c) Σi=1n (xi − c)2 è minimo per c = x̄
- d) x̄ = 1/n Σi=1n xi M(+) (+) frequento del sottoinsieme disgiunto
- e) γ = bx + β
Formica della media generale (suddiviso in sottoinsiemi il collettivo)
x̄ = 1/n (x̄1(h) + x2 (m−h))
* Coefficiente di Variazione (C.V.)
per risolvere i problemi della varianza e della deviazione standard.
C.V = S/X̄ x 100
* Campo di Variazione
0 <= G2 <= 10
* Altri Indici di Variabilità
→ Scostamenti Semplici Medi
Scostamento semplice dalla media aritmetica.
Sx = 1/n ∑i=1n |xi - X̄|
nel caso di distribuzione di frequento
Sx = 1/M ∑j=1k |xj - X̄| mj = ∑j=1k |xj - X̄| fj
Scostamento semplice dalla mediana
Sme = 1/n ∑i=1m |xj - Me|
nel caso di distribuzione di frequento
Sme = 1/M ∑j=1k |xj - Me| mj = ∑i=1k |xj - Me| fj
* Indici Percentuali di Variabilità
Sx/X̄ x 100 e Sme/X̄ x 100
* Campo di Variazione è molto approssimato
R = Xn - X1
se il carattere è suddiviso in classi
R = 1/n - 1
* Differenza Intequartile
W = Q3 - Q1
in questo modo si escludono valori anomali.
PROBABILITA
La negazione
di A (complemento di A):
A = {ω ∈ Ω / ω ∉ A}
L'intersezione
A ∩ B (gli eventi A e B si verificano contemporaneamente):
= {ω ∈ Ω / ω ∈ A e ω ∈ B}
L'unione
A ∪ B (almeno uno degli eventi A e B si verifica):
= {ω ∈ Ω / ω ∈ A o ω ∈ B, o ω ∈ se o A, sia o B}
Proprieta distributiva
3 eventi A, B, C.
A ∩ (B ∪ C) = (A ∩ B) ∪ (A ∩ C)
A ∪ (B ∩ C) = (A ∪ B) ∩ (A ∪ C)
A ∪ B = A A B
Proprieta
Ω ∪ Ω = Ω
Ω ∩ Ω = ∅
Evento certo (si verifica sempre in quanto comprende tutti i possibili risultati dell'esperimento)
Ω = Ω (ne negazione dell'evento impossibile)
Evento impossibile (1 evento che nn puo mai verificarsi)
A ∩ A = B ∩ B = C ∩ C ecc. = ∅
Relazione di inclusione (l'inclusione non esclude la perfetta coincidenza tra due eventi)
A ∪ B = A => B C A (vincolo)
A ∪ C + C => A C C
p(y|x) = p(x,y) / p(x)
TRA LE V.C. DOPPIE C’È INDIPENDENZA SE:
p(x,y) = p(x)*p(y)
⟹
p(x|y) = p(x,y) / p(y) ⟺ p(x)*p(y) / p(y) = p(x)
e viceversa
VALORE ATTESO
E(x₁ + x₂) = E(x₁) + E(x₂)
E(x₁ - x₂) = E(x₁) - E(x₂)
COVARIANZA
∑xy = Cov(x,y) = E[(x-E(x)) (y-E(y))]
Si calcola come: ∑∑ (x-E(x)) (y-E(y)) p(x,y)
∑xy = E(x*y) - E(x)E(y)
Quando X e Y sono indipendenti la covarianza si annulla
VARIANZA
VAR(x + y) = VAR(x) + VAR(y) + 2 cov(x,y)
VAR(x - y) = VAR(x) + VAR(y) - 2 cov(x,y)
Se e v.c. sono tra loro indipendenti
⟹
VAR(x+y) = VAR(x) + VAR(y)
VAR(x-y) = VAR(x) + VAR(y)
Teorema di Chebyshev
(probabilità delle code)
P(|X - E(X)| <= kσ) >= 1/k2
Campionamento
Parametri della popolazione:
media:
μ = (1/N) ∑i=1N xi
μ = ∑j=1k xjp(xi) = E(X)
varianza della popolazione:
σ2 = (1/N) ∑i=1N (xi - μ)2 = (1/N) ∑i=1N xi2 - μ2
σ2 = ∑j=1k (xi-μ)2 p(xi) = ∑j=1k (xj)2 p(xj) - μ2
Statistica - Media Campionaria
Media campionaria
X̄ = (x1 + x2) / m
X̄ = (1/m) ∑i=1n xi
Varianza campionaria
S2(X) = (1/n) ∑i=1n (xi - X̄)2
S(X) = √s2
MAX campionaria
x(h) = max (x1, x2, ..., xn)
MIN campionaria
x(l) = min(x1, x2, ..., xn)
Intervallo di variazione campionaria
R = X(h) − X(l)
VERIFICA DI IPOTESI
Impostare un sistema di ipotesi
- H0: μ1 = μ2
- H1: μ1 ≠ μ2
- H1: μ1 > μ2
- H1: μ1 < μ2
α: è la probabilità di commettere un errore del 1o tipo.
β: è la probabilità di commettere un errore del secondo tipo.
β = P (Z < Zβ )
STATISTICA TEST
Il valore della stima puntuale calcolato sul campione standardizzato sotto ipotesi nulla (assumo vera H0).
* Nel caso di una proporzione
Z = X̄ - μ / G/√n ~ N
Z = X̄ - X0 / √(Σ(X - X̄)2)/√n ~ N
p-value:
è probabilità di assumere il valore della stima puntuale più esterno (nella direzione di H1) di quello osservato sul campione e sotto ipotesi nulla rappresenta una misura della distanza tra X̄ e M in termini probabilistici.
Nel caso in cui G = X
Usando dati si usa una stima corretta sia della varianza che della media.