TEOREMA CENTRALE DEL LIMITE (TCL)
Da un campione devo poter dire qualcosa della popolazione che l'ha generato.
SX = {1, 2, 3}
P(X=1) = P(X=2) = P(X=3) = 1/3
X1 ~ Ud (1, 3)
X2 ~ Ud (1, 5)
S2 = X1 + X2 → {2, 3, 4, 5, 6} 1 1 1 P(S1) 1 1/9 1/9 1/9
2, 3, 4, 5, 6
La distribuzione di S2 non è più uniforme.
S3 = X1 + X2 + X3
= S2 + X3
2* 1/27A mano a mano che aumentoil campione, la distribuzioneda discreta diventa continua.
TEOREMA CENTRALE DEL LIMITE (TCL)
Da un campione devo poter dire qualcosa della popolazione che l'ha generato
SX = {1, 2, 3}
P(X = 1) = P(X = 2) = P(X = 3) = 1/3
1/31/31/3X1 ~ Ud(1, 3) X2 ~ Ud(1, 5)
variabile discreta
SX2 = X1 + X2 → {2, 3, 4, 5, 6}
123123423453456S3P(S3)21/932/943/952/961/9La distribuzione di S2 non è più uniforme
S3 = X1 + X2 + X3 = S2 + X3
2345671/33456781/34567891/35678910S3P(S3)31/2743/2756/2767/2776/2783/27A mano a mano che aumenti il campione, la distribuzione da discreta diventa continua
TCL (per la somma)
DEF. Sono x1, x2, …, xm m variabili casuali indipendenti ei identicamente distribuite + c. G(gxi) = μ e V(x) = σ26 posto Sm = x1, x2, …, xm allora Sm ≈ N (mμ, mσ2)
OSSERVAZIONI
1. E(Sm) = E(x1 + x2 + … + xm)= E(x1) + E(x2) + … + E(xm)ma visto che sono IID, E è uguale E = μ= μ + μ + … + μ = Mμ
2. V(Sm) = V(x1 + x2 + … + xm)= V(x1) + V(x2) + … + V(xm)= σ2 + σ2 + … + σ2 = Mσ2
3. Se x1, x2, …, xm fossero tutte normali indipendenti xi ≈ N(μ, σ2), e Sm ≈ N(mμ, mσ2) allora Sm√a ≈ N(mμ, mσ2)
(N.B. dice che cosa rappresentano le incognite, altrimenti vengono totti dei punti all'esame)
Esercizioxi ≈ Ud(1, 3) Sa = {1, 2, 3}E(xi) = 2V(xi) = \[ \frac{1}{3} [(1-2)2 + (2-2)2 + (3-2)2] \] = \frac{2}{3}
se n = 100
S100 = x1 + x2 + ... + x100
SX = {100, 101, ..., 300}
non è una normale ma posso approssimarla ad una normale
Sm ~a N (400; 2) media
P(S100 > 210) → P(S100 > 210 - 200)√66,7
- P(z > 108,47) - P(z ≥ 1,22)
1 - Ⓘ (1,22) - 1 - 0,8888 - 0,1112
vuol dire che in media 11,12 volte su 100 la somma è ≥ 240
TCL (per la media)
DE. siano x1, x2, ..., xm n VC IID tali che
(xi) = μ V(xi)= σ2
posso
x = x1 + x2 + ... + xm = Smm
allora
x ~a N (μ, σ2/m)
OSSERVAZIONI:
1o (x) = (Sm) = 1/m (Sm) = μ/m 0 = μ - μ
- es.
- {1, 2, 3} 2 ∈ ℂℝ
- (1, 1) (2, 1) (3, 1) = 2
- (1, 2) (2, 2) (3, 2) = 2.5
- (1, 3) (2, 3) (3, 3) = 3
1,5 3 2
la media di tutte le medie di tutte le funzioni dell'universo che posso fare è la media dell'unica originale
2oV(X̅) = V(Sm/m) = 1/m2 V(Sm) = 1/m2 × 62 / m
Esempio
Giocare alla roulette francese non truccata.T= 18/37 la vc che descrive l’evento A = “viene rosso” al lancio i-esimo, Xi ∼ Ber (18/37 = 0,4865)
Yi = 2Xi - 1
- OSSERVAZIONE
- Se X = 1 (viene rosso) → Y = 2 · 1 - 1 = 1€ (vinciamo 1€)
- X = 0 → 2· 0 - 1 = - 1 (perdiamo 1 €) su una singola giocata
E(Xi) = 0,4865V(Xi) = V(Xi - T)2 = 0,2498
E(Yi) = E(2Xi - 1) = 2 E(Xi) - 1 = 2 · 0,4865 - 1 = -0,027V(Yi) = V(2Xi - 1) = 22 V(Xi) = 4 · 0,2498 = 0,9993
Se m = 100G100 = Y1 + Y2 + ... + Ym = D la somma dei guadagni/perdite
di tutte le giocatela probabilità di G100 che contiene tanti valori si può descrivere benecon una normale (TEOREMA CENTRALE DEL LIMITE)
G100 ≈ N(100 · (-0,027)/√2, 100 · (0,9993)/99,93)
A) Qual è la probabilità di PERDERE in 100 giocate?
P(G100 < 0) > 1/2Naturalmente lo possiamo calcolare riuscendo a chiarire perché l’intera tot vincita 37 (tavola) 36 = 1casa favorevole = 18
P(G100 < 0) = P(G100 - E(G100)/σ√G100) = 0 + 2,7/9,996 = 0,0605 → 60,65% delle volte si perde
P(100 <= 20) = 0,0418 — probabilità che persona più di 20
P(100 > 20) = 0,0158 — probabilità di vincere 20
combinazioni possibili al superenalotto → (90)6
probabilità di vincere → 1/(90)6
diano x1, x2, ..., xm n VC di Bernoulli identicamente distribuite i.i.d.
E(xi) = π e V(xi) = π(1-π)
esempio
M = 10
1 + 1 + 0 + 0 + 1 + 1 + 1 + 0 + 0 + 1 = 610
= 0,6
fare la media di Bernoulli è farela frequenza relativa
TCL (per la proporzione o freq. relativa)
diano x1, x2, ..., xm n VC di Bernoulli(o dicotomiche) xi ~ Bern(π)
pon
&hat;πn = x1 + x2 + ... + xm m
allora
&hat;πn ≈ N(π, π(1-π) ) m
Esercizi tipo
- Descrivere un TCL
- Applicazione del TCL scritto precedentemente
Esercizio:
TCL per la somma
Si lancia un dado 100 volte, determinare la probabilità che la somma sia minore di 330
- i: quale faccia assume il dado
P(i=x) = 1/6, x = 1, 2, …, 6
E(i) = ∑x∈di x P(i=x) = 1·1/6 + 2·1/6 + 3·1/6 + 4·1/6 + 5·1/6 + 6·1/6
= 3,5
V(i) = ∑x∈di x2 P(i=x) - E2(i)
= (12·1/6 + 22·1/6 + 32·1/6 + 42·1/6 + 52·1/6 + 62·1/6), 3,52
2,917
N = 100 S = i, 2, …, 100
Sm ≈ N (100 · 3,5 , 100 · 2,917)
P(Sm < 330) = P &left( Sm - ESm /SD(Sm) < 330 - 350/√294,7 &right)
= P(Z < -1,17)
= 1 - P(Z < 1,17)
= 1 - Φ(1,17) = 0,121
TCL per la media
Premio una urna che contiene palline 1 2 2 3 5, n = 25.
- Calcolare il E su ogni estrazione, cioè:
E(xi) = ∑x∈dx x • P(x = x)
= 1 • 1/5 + 2 • 2/5 + 3 • 1/5 + 5 • 1/5 = 2,6
- Calcolare il V su ogni estrazione
V(xi) = ∑x∈dx x2 • P(x = x) - E2(x)
= 12 • 1/5 + 22 • 2/5 + 32 • 1/5 + 52 • 1/5 - 2,62 = 1,84
x̄ = x1 + ... + x25 / 25 ~ N (2,6 ; 1,84/25)
P(x̄ > 3) = P (x̄ - E(x̄) / σ(x̄) > 3 - 2,6 / √0,073)
= P(z > 1,1(z)) = 1 - Φ(1,1(z)) = 0,0708
Osservazione:
x1, … , xm xi ~ Ber (π ; 1/2)
Sm = x1 + x2 + … + xm ~ Bin (m ; ẵ)
Se m è piccolo, abbiamo la misura precisa di come si comportano le prove di Bernoulli:
P(Sm = s) = (m/s) πs ẵ (1 - π/1)(m-s)
90
Voglia la probabilità che su M=1000 lanci di una moneta
perfetta, obtia esattamente S=500 teste:
P(S=500)=1000C500(1⁄2)500(1⁄2)500
se P(400 < S1000 < 600)=
Σ P(S1000-X)
S1000 ∼ N (1000 · 1⁄2; 1000 · 1⁄2 · 1⁄2⁄500)
P(400 < S1000 < 600)=P(400-500⁄√250 < Z < 600-500⁄√250)
TEORIA_
- Distribuzione χ2
Sia X1,...,Xm m Vc IID, tutte quante normali
standard, cioè
Xi ∼ N (0,1)
Y è definita come la somma di quadrati dell' m
normali standard cioè:
Y=X12 + X22 + ... + Xm2 ∼ χ2m
dove m sono i gradi di libertà
SY∈ ℝ [0; +∞), E(y)=m, V(x)=2m
- T di Student
Siano Z ∼ N (0,1) e y ∼ χ2m con m gradi di
libertà, la vc
T= Z⁄√Y⁄m ∼ tm (è una t student con m gradi di
libertà)
-
statistica
-
Statistica
-
Lezioni, Statistica
-
Esercizi Statistica tipo 6 (Intervalli di confidenza, teorema centrale del limite, test statistici, t-Student, sign…