Elementi di probabilità e statistica - Inferenza Statistica

E' l'elaborato, più che appunto per l'esame di elementi di probabilità e statistica del prof Mattioli, frutto di un semestre di corso a mio parere molto esaustivo e accessibile. …

Esame Elementi di probabilità e statistica

Facoltà Economia

Dal corso del Prof. Mattioli Elvio

Università Università Politecnica delle Marche - Ancona

Publisher Giuseppe Di palma

A.A. 2013-2014

68 pagine

3 download

Appunto

Vota 3,5 / 5 (2)

Scarica

Estratto del documento

V X X X

( ) ( )

=V ∗X =E −E

n n n

i=1 i

2 2 2 2 2 2 2 2

0 1 1.5 2 2.5 3 3.5 4 56

∗1 ∗1 ∗1 ∗1 ∗2 ∗2 ∗1 ∗1

́ 2

( )

E X = + + + + + + + =

n 36 9 9 6 9 9 9 36 9

56 49 7

2 2

́ ́ ́

( )

V X X X

( ) ( )

=E −E = − =

n n n 9 9 9

V X

( )

V X

( ) =

n 2

Distribuzione della variabile casuale media campionaria: ́

X

Per determinare la distribuzione della sopracitata variabile n-dimensionale , come si vedrà ci

basta conoscere la distribuzione della variabile X della popolazione; vanno distinti due possibili

casi:

1. Se la variabile casuale X riferita alla popolazione con la quale campioniamo è distribuita in

modo normale (gaussiano):

( )

X N μ ,σ

Allora si dimostra che anche la variabile casuale Media campionaria, relativa all’”n-pluo

campione” scelto è anch’essa distribuita in modo normale:

( )

X N μ ,

n n

Esempio grafico:

Sia la v.c. X distribuita in modo gaussiano con media pari a 10 e varianza pari a 9: ciò che

all’occhio si nota è una distribuzione molto dispersa rispetto al valore atteso/media. Da

quanto detto la v.c. media campionaria relativa al campione scelto, risulta distribuita in

modo anch’essa quindi normale e supponiamo di ordine 10 con media chiaramente come

dimostrato pari a 10 e varianza , cioè 0,9: si nota immediatamente come la

distribuzione di quest’ultima variabile, grazie ad una varianza molto bassa, sia molto

concentrata intorno alla media della media campionaria stessa e quindi della popolazione

campionata: il campione scelto è pertanto abbastanza soddisfacente, in quanto descrive

con una certa affidabilità la popolazione di riferimento.

2. Se la popolazione statistica X (se la v.c.) è di tipo bernoulliano, cioè presenta due sole

modalità: insuccesso = 0 e successo = 1, con probabilità di successo pari a

X Bernoulli θ

( )

S

allora è distribuita secondo la legge binomiale

S Binomiale(n , θ)

n S

Inoltre dato che le modalità di X assumono valore o 0 o 1, risulta coincidere con il

numero dei successi osservati nel campione (frequenza assoluta campionaria) e

S

́ n

X = la frequenza relativa campionaria di successo.

n n

3. La variabile casuale X riferita alla popolazione con la quale campioniamo non è distribuita

in modo normale (gaussiano) o più semplicemente ha una distribuzione ignota (non

sappiamo che distribuzione ad es. associare alla popolazione):

X non Normale

Tuttavia sotto ipotesi abbastanza restrittive, per ciò che riguarda la v.c. Media Campionaria

V X

( ) <∞

estratta dalla popolazione, quale valore della varianza finito ( ) e dimensione n

del campione sufficientemente grande

→ ∞: valore non necessariamente esagerato , anche n=100 ad es.)

(n , sebbene la variabile

X abbia distribuzione incognita, possiamo con un certo margine di certezza affermare che

( )

μ,σ

́ ́

X → X N

n n n

L’importanza di questo risultato è notevole: pur non avendo nessuna informazione sulla

popolazione, risulta ragionevole approssimare la legge di distribuzione della media

campionaria con una legge normale (per varianza finita e dimensione sufficientemente

grande).

ovvero la media campionaria in quelle condizioni tende ad essere distribuita normalmente.

Nell’ipotesi prima accennate, quanto precedentemente asserito è permesso dal seguente

enunciato che non si andrà tuttavia a dimostrare:

"Teorema del limite centrale" – versione di Lindberg-Lèvy

S

Data una successione di n variabili casuali “i.i.d.” costituenti apposita variabile casuale e

aventi varianza finita, n

∑

S X , X , … , X X con n=1,2,…

( )

= =

n 1 2 n i

i=1

che decidiamo di standardizzare ottenendo una ulteriore variabile casuale,

S −E(S )

n n

Z =

n √ V (S )

n Z

n → ∞

Allora per ( ) si dimostra che la successione standardizzata tende ad essere una

v.c. normale standardizzata: questa convergenza è meglio nota come “Convergenza in legge (o

in distribuzione)”:

L.

Z → Z N (0,1)

Vediamo la convergenza graficamente:

Nota bene:

Viene detta anche Convergenza in distribuzione per la seguente espressione:

z −1

1 ∗t

∫ 2

lim F z lim P Z ≤ z dt=F z

( ) ( )

= = ∗e ( )

Z i n i z i

√ 2π

n →∞ n→∞ −∞

Applichiamo il teorema del limite centrale prima esposto per dimostrare la espressione:

( )

μ,σ

́ ́

X → X N

n n n

Riprendendo il teorema della media della combinazione lineare precedentemente visto e

S X , X , … , X

applicandolo alla successione di variabili casuali ,

n 1 2 n

otteniamo n

( )

∑

E S E X

( ) =

n i

i=1

.. dove si nota i pesi a sono tutti pari a 1 essendo≤v . c . i.i.d ; ma posso allora anc h e scrivere ..

n n n

∑ ∑ ∑

E S E( X E X .=μ∗n

( ) = )= ( )=μ∗

n i

i=1 i i=1

=1 S

Analogamente vale per la varianza della successione n

n n n

( )

∑ ∑ ∑ 2

V S X V X V

( ) =V = ( )= (X )=σ ∗n

n i i

i=1 i=1 i=1

Dal teorema sappiamo allora che:

S S

−E(S ) −μ∗n

n n n L.

Z Z N 0,1 ; questo per n→ ∞

( )

= = =→

n √ √ 2

V S

( ) σ ∗n

n n

∑ X i

S

..sapendo che , dividendo e moltiplicando l’espressione per “n” ottengo..

n i=1 X

= = n

n n

Ottengo così la Media campionaria Standardizzata:

X −μ

n L.

Z Z N 0,1

( )

= =→

n √ n∗σ

In tal caso allora

X → N 0,1

( )

n Esempio 0:

Esempio 1:

Data una popolazione di votanti, si consideri l’evento e variabile X ”intervistato che vota per partito

immaginario H”; ipotizzo anche che

P A

( )=π=0.7 ́

P A

( )=0.3

sì che

Poniamo di voler procedere ad una estrazione casuale dalla popolazione, la quale in

considerazione all’evento prefissato sarà costituita da votanti per H e non votanti per H (per

semplicità chiaramente si escludono coloro che non votano o votano per altri partiti).

Innanzitutto la distribuzione della variabile X sarà:

{ x : 0 1

X = P( X) 1−π=0.3 π=0.7

Nello specifico la variabile casuale X risulta distribuita secondo un particolare tipo di binomiale,

avente un numero di tentativi dell’esperimento pari ad 1: sto parlando chiaramente della

Bernoulliana:

X Bernoulliana π=0.7)

(n=1;

Andando a studiare meglio la variabile, determiniamone le caratteristiche essenziali:

E X

( )=μ=π=0.7

- V X 1−π

( )=π ( )=0.21

Voglio adesso considerare un campione casuale n-dimensionale o (n-pluo) da estrarre dalla

popolazione: a tal fine procederò con un campionamento bernoulliano con ripetizione, ovvero

intervisterò in modo bernoulliano n individui; formalizziamo:

Passo dalla v.c. dimensionale costituente il campione alla realizzazione della variabile stessa,

grazie questo chiaramente all’intervista:

X , X , … , X →(x , x , … , x

( ) )

1 2 n 1 2 n

Supponiamo adesso di fare 5 interviste, quindi determinando un campione 5-pluo (numerosità del

n=5

campione ) e che la realizzazione del campione, a seguito dell’intervista, sia

X , X , X , X , X → x , x , x , x , x

( ) ( )

=(1,0,1,1,0)

1 2 3 4 5 1 2 3 4 5

..dove chiaramente 0 sta per “non votante per partito H” e 1 per “votante”..

Successivo passo consiste, data la nuvola campionaria o semplicemente il 5-pluo campione,

S

considerare la sommatoria delle sue componenti (le 5 variabili casuali) , a sua volta variabile

n S

casuale (dipende dalle n variabili scelte per il campione) e la realizzazione di stesso;

rispettivamente abbiamo:

∑

S X

n i

i=1 S

Chiaramente potrà assumere valori da un minimo di 0 a un max di 5, essendo la numerosità

n S n=5

=0,1,2,3,4,

della dimensione del campione pari a 5: .

La sommatoria delle realizzazioni sarà invece:

∑

s x

n i

i=1

Che nell’esempio risulta:

∑

s x 3 intervistati su 5 votano per H

( )

= =3

5 i

i=1 S

Introdotto , dal momento che l’esperimento per cui ho campionato la popolazione consiste

nel determinare quanti x votanti per H ci sono tra gli n intervistati, posso affermare che la mia

S

variabile “Somma della nuvola campionaria” è distribuita in modo binomiale:

S Binomiale(n , π )

Andiamo a descriverla con opportuni indici:

Circa la media aritmetica:

n n

( )

∑ ∑

E S E X per il teorema osservato sulla combinazione lineare= E( X

= = )

( )

n i i

i=1 i=1

∑

essendo≤componentii.i.d.= E X visto prima=n∗π

¿ ( )=n∗μ=come

i=1

Circa la varianza:

n n n

( )

∑ ∑ ∑ 2

V S X V X V visto pr ima=n∗π

( ) =V = ( )= (X )=n∗σ =come (1−π )

n i i

i=1 i=1 i=1 V X

( )=π (1−π )<∞

Supponendo adesso che la varianza della popolazione sia finita , procedo

applicando alla variabile “Somma della nuvola campionaria 5-pla” il teorema precedentemente

visto del limite centrale:

n→∞

“Se S S S

−E( ) −n∗π

n n n

Z f orma generica= specifica=

=come =e

n √

√ V S n∗π

( ) (1−π )

Allora

S → N (0,1)

Esempio 2: voglio verificare quanto appena detto immaginando di voler trovare una certa

probabilità di verificarsi di un evento, tramite uno stesso campione, con numerosità n

sufficientemente grande, riferito ad una stessa popolazione, prima applicando il teorema del limite

centrale e quindi distribuendolo in modo normale e in seguito distribuito in modo binomiale (come

effettivamente si era supposto in precedenza):

1 – Sia la stessa variabil

Anteprima

Vedrai una selezione di 10 pagine su 68