Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
MEDIA CAMPIONARIA
MEDIANA CAMPIONARIA
mettere i valori in ordine crescente ed individuare il valore centrale
se i valori somo pari - 1 valore
se i valori somo dispari - 2 valori
MEDIA TRONCATA
ottenuta togliendo a% dei valori più grandi e a% dei valori più piccoli
RANGE
VARIANZA CAMPIONARIA
scarto quadratico medio
spazio campionario = insieme di tutti possibili esiti di un esperimento statistico
EVENTO: sottoinsieme di uno spazio campionario
COMPLEMENTARE
INTERSEZIONE
DISGIUNTA
NON
UNIONE
Probabilità
m/N = casi favorevoli (all’evento in questione) / casi possibili
Proprietà
- Monotonia: A ⊆ B P(A) ≤ P(B) Se si realizza B, si realizza anche A ma non viceversa
- Complementare: P(Aᶜ) = 1 - P(A) Se si realizza un evento, il suo complementare non si può realizzare quello stesso evento
- Regola additiva: P(A ∪ B) = P(A) + P(B) - P(A ∩ B) Vale sia per unione che per intersezione
Eventi Indipendenti
A e B sono indipendenti se P(B) = P(B|A) O P(A) = P(A|B) ⇔ P(A ∩ B) = P(A) · P(B)
Quindi P(A ∩ Bᶜ) = P(A) · P(Bᶜ) = 1 - P(A ∪ B)
Teorema di Bayes
P(B|A) = P(B) · P(A|B) / P(A)
P(A) = P(B)·P(A|B) + (B₁)·P(A|B₁) + P(B₂)·P(A|B₂)
Esempio 2.46
Adulto ≥ 60
Camoro Diagnosticato P(D|C) = 0.78 Non Diagnosticato 0.05
Non Diagnosticato P(C|D) = P(D|C) · P(C)
P che un adulto ≥ 60 anni cerca una diagnosi di essere affetto da camoro
P = (P(D|C) · P(C)) + (P(D|C) · P(C)) = = (0.70 · 0.05) + (0.06 · 0.05) = 0.056
Proprietà Valore Atteso
Sia X una v.a. (d) discreta o continua. Siano a e b costanti
- E(a) = a
- E(bX) = bE(X) ∀b ∈ R
- E(a + bX) = a + bE(X) ∀a, b ∈ R
Teorema: Linearità
Valore Atteso
E(aX + bY) = aE(X) + bE(Y) = Σ Σ (aX + bY)f(x,y)
= a Σ xg(x) + b Σ yh(y)
Teorema:
X e Y sono v.c. indipendenti
E(XY) = E(X) · E(Y)
Proprietà Varianza
Sia X una v.c., E(X) = m e
- Var(X) = E((X − E(X))²) = E(X²) − m²
- Var(a) = 0, ∀a ∈ R
- Var(bX) = b²Var(X) ∀b ∈ R
- Var(a + bX) = b²Var(X) ∀a, b ∈ R
Var(X + Y) = Var(X) + Var(Y) + 2cov(X,Y)
Cov(X,X) = E(XY) − E(X) · E(Y) = E(X)
Teorema:
X e Y sono v.c. indipendenti
Var(X + Y) = Var(X) + Var(Y)
Esponenziale
Modellare tempo di vita di utensili
x > 0 f(x) = λe-λx x > 0 (esponenziale negativa)
= (x, y) = = { 0 x≤0 0, altrimenti }
F(x) = ∫-∞x f(ξ) dξ = ∫0x λe-λt dt = 1-e-λx
Valore atteso 1/λ
Varianza 1/λ2
Teoremi di distribuzione esponenziale e Poisson vedi slide
Teorema mancanza di memoria
Stimatore di media campionaria
La media campionaria Xm è uno stimatore corretto e consistente per N se E(Xm)=N e Var(Xm)=n/m.
Stimatore corretto per la varianza
Sia (X1, X2, ..., Xm) un campione i.i.d. con E(Xi)=E e Var(Xi)=σ2:
Sm = 1/(m - 1) Σ (Xi - Xm)2 è uno stimatore corretto per σ2.
Metodo per generare uno stimatore
→ Parametri da stimare: valore atteso E e varianza σ2. Si usa la media aritmetica (Xm) dei dati campionari.
- Dei momenti: modelli statistici con 2 parametri. Gli stimatori si ottengono tramite sistema di 2 equazioni. Eguagliando (media campionaria al valore atteso delle v.c. campionarie e equazioni eguagliando varianza campionaria con varianza delle v.c. campionarie).
Massima verosimiglianza
Stimatore definito come quei valori dei parametri per cui la funzione di log-verosimiglianza ha un massimo globale.
Funzione di Verosimiglianza
Sia (X1, X2, ..., Xm) un campione casuale di v.c. (discrete o continue):
V(θ, x1, x2, ..., xm) = V(θ) = Πif(xi; θ)
È chiamata funzione di verosimiglianza, ovvero, una funzione che descrive al variare di θ quanto sono verosimili i dati sperimentali.
Funzione di log-verosimiglianza
L(θ) = Σi=1m ln f(xi; θ)
I.C. per la differenza di 2 medie e 2 campioni
X e Y 2 popolazioni
D(X) = μ1 e σ12
E(Y) = μ2 e σ22
fissato il livello di confidenza pari a 1-α, l'intervallo di fiducia 1-α per la differenza delle medie due popolazioni μ1 - μ2 è dato da
μ1 - μ2 ∊
x̄1 - x̄2 ± z1-α/2 √1/m1 + s22/m2
μ1 - μ2 ∊ (x̄1 - x̄2 + z1-α/2 √s12/m1 + s22/m2)
I.C. per la differenza di 2 medie con varianza uguale ma non nota
X e Y 2 popolazioni
D(X) = μ1
E(X) = μ2
σ12 = σ22 = σ2
intervallo di confidenza a livello 1-α è dato
x̄1 - x̄2 + tm1+m2-2, 1-α/2 sp√1/m1 + 1/m2
sp = √1/m1 + 1/m2
Ldsp2 = (m1-1)s12 + (m2-1)s22/m1 + m2 - 2
I.C. per la differenza tra due proporzioni
2 popolazioni X e Y con parametro incognito E(X) = p1 e F(Y) = p2
intervallo di confidenza a livello 1-α
p̂A - p̂B ± z1-α/2√p̂1(1 - p̂1)/m1 + p̂2 (1 - p̂2)/m2
V.I. nel caso di norma non nota
X̄m - μ0 / s / √m
- Unilaterale DX
- H0: μ ≥ μ0
- H1: μ < μ0
Si rifiuta H0 se t > tm-1, α
- Unilaterale SX
- H0: μ ≤ μ0
- H1: μ > μ0
Si rifiuta H0 se t < -tm-1, α
- Bilaterale
- H0: μ = μ0
- H1: μ ≠ μ0
Si rifiuta se T è all'esterno
[-tα/2, m-1; tα/2, m-1]
V.I. per σ²
- H0: σ² = σ²0
- H1: σ² ≠ σ²0
G² = (m-1) ⋅ Sm / σ²0 ~ χ²m-1
- Unilaterale DX
- Rifiuto se G² > χ²1-α, m-1
- Unilaterale SX
- Rifiuto se G² < χ²α, m-1
- Bilaterale
- Rifiuto se G² è all'esterno di [χ²α/2, m-1; χ²1-α/2, m-1]