Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
V X X X
( ) ( )
=V ∗X =E −E
n n n
n
i=1 i
2 2 2 2 2 2 2 2
0 1 1.5 2 2.5 3 3.5 4 56
∗1 ∗1 ∗1 ∗1 ∗2 ∗2 ∗1 ∗1
́ 2
( )
E X = + + + + + + + =
n 36 9 9 6 9 9 9 36 9
56 49 7
2 2
́ ́ ́
( )
V X X X
( ) ( )
=E −E = − =
n n n 9 9 9
V X
( )
́
V X
( ) =
n 2
Distribuzione della variabile casuale media campionaria: ́
X
Per determinare la distribuzione della sopracitata variabile n-dimensionale , come si vedrà ci
n
basta conoscere la distribuzione della variabile X della popolazione; vanno distinti due possibili
casi:
1. Se la variabile casuale X riferita alla popolazione con la quale campioniamo è distribuita in
modo normale (gaussiano):
2
( )
X N μ ,σ
Allora si dimostra che anche la variabile casuale Media campionaria, relativa all’”n-pluo
campione” scelto è anch’essa distribuita in modo normale:
2
( )
σ
́
X N μ ,
n n
Esempio grafico:
Sia la v.c. X distribuita in modo gaussiano con media pari a 10 e varianza pari a 9: ciò che
all’occhio si nota è una distribuzione molto dispersa rispetto al valore atteso/media. Da
quanto detto la v.c. media campionaria relativa al campione scelto, risulta distribuita in
modo anch’essa quindi normale e supponiamo di ordine 10 con media chiaramente come
9
dimostrato pari a 10 e varianza , cioè 0,9: si nota immediatamente come la
10
distribuzione di quest’ultima variabile, grazie ad una varianza molto bassa, sia molto
concentrata intorno alla media della media campionaria stessa e quindi della popolazione
campionata: il campione scelto è pertanto abbastanza soddisfacente, in quanto descrive
con una certa affidabilità la popolazione di riferimento.
2. Se la popolazione statistica X (se la v.c.) è di tipo bernoulliano, cioè presenta due sole
θ
modalità: insuccesso = 0 e successo = 1, con probabilità di successo pari a
X Bernoulli θ
( )
S
allora è distribuita secondo la legge binomiale
n
S Binomiale(n , θ)
n S
Inoltre dato che le modalità di X assumono valore o 0 o 1, risulta coincidere con il
n
numero dei successi osservati nel campione (frequenza assoluta campionaria) e
S
́ n
X = la frequenza relativa campionaria di successo.
n n
3. La variabile casuale X riferita alla popolazione con la quale campioniamo non è distribuita
in modo normale (gaussiano) o più semplicemente ha una distribuzione ignota (non
sappiamo che distribuzione ad es. associare alla popolazione):
X non Normale
Tuttavia sotto ipotesi abbastanza restrittive, per ciò che riguarda la v.c. Media Campionaria
V X
( ) <∞
estratta dalla popolazione, quale valore della varianza finito ( ) e dimensione n
del campione sufficientemente grande
→ ∞: valore non necessariamente esagerato , anche n=100 ad es.)
(n , sebbene la variabile
X abbia distribuzione incognita, possiamo con un certo margine di certezza affermare che
2
( )
μ,σ
́ ́
X → X N
n n n
L’importanza di questo risultato è notevole: pur non avendo nessuna informazione sulla
popolazione, risulta ragionevole approssimare la legge di distribuzione della media
campionaria con una legge normale (per varianza finita e dimensione sufficientemente
grande).
ovvero la media campionaria in quelle condizioni tende ad essere distribuita normalmente.
Nell’ipotesi prima accennate, quanto precedentemente asserito è permesso dal seguente
enunciato che non si andrà tuttavia a dimostrare:
"Teorema del limite centrale" – versione di Lindberg-Lèvy
S
Data una successione di n variabili casuali “i.i.d.” costituenti apposita variabile casuale e
n
aventi varianza finita, n
∑
S X , X , … , X X con n=1,2,…
( )
= =
n 1 2 n i
i=1
che decidiamo di standardizzare ottenendo una ulteriore variabile casuale,
S −E(S )
n n
Z =
n √ V (S )
n Z
n → ∞
Allora per ( ) si dimostra che la successione standardizzata tende ad essere una
n
v.c. normale standardizzata: questa convergenza è meglio nota come “Convergenza in legge (o
in distribuzione)”:
L.
Z → Z N (0,1)
n
Vediamo la convergenza graficamente:
Nota bene:
Viene detta anche Convergenza in distribuzione per la seguente espressione:
2
z −1
1 ∗t
∫ 2
lim F z lim P Z ≤ z dt=F z
( ) ( )
= = ∗e ( )
Z i n i z i
√ 2π
n
n →∞ n→∞ −∞
Applichiamo il teorema del limite centrale prima esposto per dimostrare la espressione:
2
( )
μ,σ
́ ́
X → X N
n n n
Riprendendo il teorema della media della combinazione lineare precedentemente visto e
S X , X , … , X
=
applicandolo alla successione di variabili casuali ,
n 1 2 n
otteniamo n
( )
∑
E S E X
( ) =
n i
i=1
.. dove si nota i pesi a sono tutti pari a 1 essendo≤v . c . i.i.d ; ma posso allora anc h e scrivere ..
i
n n n
∑ ∑ ∑
E S E( X E X .=μ∗n
( ) = )= ( )=μ∗
n i
i=1 i i=1
=1 S
Analogamente vale per la varianza della successione n
n n n
( )
∑ ∑ ∑ 2
V S X V X V
( ) =V = ( )= (X )=σ ∗n
n i i
i=1 i=1 i=1
Dal teorema sappiamo allora che:
S S
−E(S ) −μ∗n
n n n L.
Z Z N 0,1 ; questo per n→ ∞
( )
= = =→
n √ √ 2
V S
( ) σ ∗n
n n
∑ X i
S
..sapendo che , dividendo e moltiplicando l’espressione per “n” ottengo..
́
n i=1 X
= = n
n n
Ottengo così la Media campionaria Standardizzata:
́
X −μ
n L.
Z Z N 0,1
( )
= =→
n √ n∗σ
In tal caso allora
́
X → N 0,1
( )
n Esempio 0:
Esempio 1:
Data una popolazione di votanti, si consideri l’evento e variabile X ”intervistato che vota per partito
immaginario H”; ipotizzo anche che
P A
( )=π=0.7 ́
P A
( )=0.3
sì che
Poniamo di voler procedere ad una estrazione casuale dalla popolazione, la quale in
considerazione all’evento prefissato sarà costituita da votanti per H e non votanti per H (per
semplicità chiaramente si escludono coloro che non votano o votano per altri partiti).
Innanzitutto la distribuzione della variabile X sarà:
{ x : 0 1
i
X = P( X) 1−π=0.3 π=0.7
Nello specifico la variabile casuale X risulta distribuita secondo un particolare tipo di binomiale,
avente un numero di tentativi dell’esperimento pari ad 1: sto parlando chiaramente della
Bernoulliana:
X Bernoulliana π=0.7)
(n=1;
Andando a studiare meglio la variabile, determiniamone le caratteristiche essenziali:
E X
( )=μ=π=0.7
- V X 1−π
( )=π ( )=0.21
-
Voglio adesso considerare un campione casuale n-dimensionale o (n-pluo) da estrarre dalla
popolazione: a tal fine procederò con un campionamento bernoulliano con ripetizione, ovvero
intervisterò in modo bernoulliano n individui; formalizziamo:
Passo dalla v.c. dimensionale costituente il campione alla realizzazione della variabile stessa,
grazie questo chiaramente all’intervista:
X , X , … , X →(x , x , … , x
( ) )
1 2 n 1 2 n
Supponiamo adesso di fare 5 interviste, quindi determinando un campione 5-pluo (numerosità del
n=5
campione ) e che la realizzazione del campione, a seguito dell’intervista, sia
X , X , X , X , X → x , x , x , x , x
( ) ( )
=(1,0,1,1,0)
1 2 3 4 5 1 2 3 4 5
..dove chiaramente 0 sta per “non votante per partito H” e 1 per “votante”..
Successivo passo consiste, data la nuvola campionaria o semplicemente il 5-pluo campione,
S
considerare la sommatoria delle sue componenti (le 5 variabili casuali) , a sua volta variabile
n S
casuale (dipende dalle n variabili scelte per il campione) e la realizzazione di stesso;
n
rispettivamente abbiamo:
n
∑
S X
=
n i
i=1 S
Chiaramente potrà assumere valori da un minimo di 0 a un max di 5, essendo la numerosità
n S n=5
=0,1,2,3,4,
della dimensione del campione pari a 5: .
n
La sommatoria delle realizzazioni sarà invece:
n
∑
s x
=
n i
i=1
Che nell’esempio risulta:
5
∑
s x 3 intervistati su 5 votano per H
( )
= =3
5 i
i=1 S
Introdotto , dal momento che l’esperimento per cui ho campionato la popolazione consiste
n
nel determinare quanti x votanti per H ci sono tra gli n intervistati, posso affermare che la mia
S
variabile “Somma della nuvola campionaria” è distribuita in modo binomiale:
n
S Binomiale(n , π )
n
Andiamo a descriverla con opportuni indici:
Circa la media aritmetica:
n n
( )
∑ ∑
E S E X per il teorema osservato sulla combinazione lineare= E( X
= = )
( )
n i i
i=1 i=1
n
∑
essendo≤componentii.i.d.= E X visto prima=n∗π
¿ ( )=n∗μ=come
i=1
Circa la varianza:
n n n
( )
∑ ∑ ∑ 2
V S X V X V visto pr ima=n∗π
( ) =V = ( )= (X )=n∗σ =come (1−π )
n i i
i=1 i=1 i=1 V X
( )=π (1−π )<∞
Supponendo adesso che la varianza della popolazione sia finita , procedo
applicando alla variabile “Somma della nuvola campionaria 5-pla” il teorema precedentemente
visto del limite centrale:
n→∞
“Se S S S
−E( ) −n∗π
n n n
Z f orma generica= specifica=
=come =e
n √
√ V S n∗π
( ) (1−π )
n
Allora
S → N (0,1)
n
Esempio 2: voglio verificare quanto appena detto immaginando di voler trovare una certa
probabilità di verificarsi di un evento, tramite uno stesso campione, con numerosità n
sufficientemente grande, riferito ad una stessa popolazione, prima applicando il teorema del limite
centrale e quindi distribuendolo in modo normale e in seguito distribuito in modo binomiale (come
effettivamente si era supposto in precedenza):
1 – Sia la stessa variabil