Statistica 2- secondo parziale

Appunti di statistica, probabilità e inferenza fatti molto bene basati su appunti personali del publisher presi alle lezioni della prof.ssa Anderlucci dell’università degli …

Esame Statistica, probabilità e inferenza

Facoltà Economia

Dal corso del Prof. Anderlucci Laura

Università Università degli Studi di Bologna

Publisher cate5

A.A. 2016-2017

37 pagine

Appunto

Vota

Scarica

Estratto del documento

Vi possono essere due modi per determinare la distribuzione di probabilità:

- trattandosi di eventi equiprobabili è possibile usufruire della definizione classica per determinare

la probabilità di ogni evento P(X= 4) = 3/36

- descrivere l’evento con unioni e intersezioni al fine ultimo di usufruire della proprietà delle

probabilità introdotte da Kolmogorov Indipendenza

P(X= 2) = P(“1 su A” ∩ “1 su B”) = P(X = 1, X = 1) == P(X = 1) P( = 1) = 1/36

a b a Xb

4° assioma

P(X= 3) = P[(“2 su A” ∩ “1 su B”) (“1 su A” ∩ “2 su B”)] ==

∪

= P(X = 2, X = 1) + P(X = 1, X = 2) = 1/36 + 1/36 = 2/36

a b a b

X 2 3 4 5 6 7 8 9 10 11 12

P(X = xi) 1/36 2/36 3/36 4/36 5/36 6/36 5/36 4/36 3/36 2/36 1/36

Funzione di ripartizione

Come nella statistica descrittiva anche nella statistica inferenziale, in alcune situazioni, potremmo

essere interessati non alla probabilità che la v.c. assuma uno specifico valore ma, bensì, alla

probabilità che essa assuma un valore minore o uguale ad un dato valore x , ossia alla probabilità

cumulata P(X ≤ x ).

In tal contesto, dunque, una funzione di ripartizione, associata ad una v.c. discreta o continua, è la

funzione che fa corrispondere ai valori X le probabilità cumulate ed è indicata con:

F(X) = P(X ≤ x)

La funzione di ripartizione gode di importanti proprietà:

1) F(X) è non decrescente, ossia x x — F(x ) F(x )

< > ≤

1 2 1 2

2) lim F(X) = 0 e lim F(X) = 1

x ∞

∞

- — >

— >

3) è continua a destra, ovvero lim F(X) = F(X )

x 0

— >

La funzione di ripartizione di una v.c. discreta è una funzione a gradini ed è definita anche in

corrispondenza a valori che la v.c. non può assumere, inoltre essa corrisponderà a:

F(X) = ∑ P(X= w) dove w ≤ x

Esempio. Funzione di ripartizione associata ad una v.c. discreta

X -1 1 3

P(X = x ) 0,2 0,5 0,3 = 1

F(-2) = P(X ≤ -2) = 0

F(-1,1) = P(X ≤ -1,1) = 0

Da come si evince la funzione di ripartizione assume valore 0 per tutti i valori inferiori al minimo.

F(-1) = P(X ≤ -1) = 0,2

F(-0,3) = P(X ≤ -0,3) = 0,2

Da come si evince la funzione di ripartizione assume valore costante nell’intervallo fra i due valori.

F(1) = P(X ≤ 1) = P (X= -1) + P(X= 1) = 0,7

F(3) = P(X ≤ 3) = P(X= -1) + P(X= 1) + P(X= 3) = 1 2° proprietà:

F(x) ∞

vale fino a

0,7

0,2

2° proprietà: ∞

vale fino a - 1

-2 -1 0 3 x

Variabili casuali continue

Le variabili casuali continue sono variabili che possono assumere tutti i valori di un intervallo

reale. Per tale motivo, dal punto di vista tecnico, non si può ragionare in termini di valori specifici

ne, tantomeno, in termini di distribuzione di probabilità perché la probabilità di un punto, essendo

questi ultimi infiniti all’interno di un intervallo, è 0.

In tal caso occorre considerare la funzione di densità che descrive, in parole povere, le

caratteristiche della probabilità associate ad una variabile continua in termini di densità attraverso

l’uso di un istogramma. In tale grafico, come nel caso della statistica descrittiva, le aree dei

rettangoli corrispondono alle densità. Dunque la funzione di densità di una variabile casuale

continua X è una funzione, f(x), per cui l’area sottesa alla funzione, corrispondente ad un certo

intervallo, è uguale alla probabilità che x assuma un valore in quell’intervallo ed è data da:

∫

f(x) = f(x)dx

Esempio. Funzione di densità

F(x)

1,5

0,5 1

0 x

0,5 0,7

La funzione di densità considera la probabilità che x assuma un valore compreso nell’intervallo

[0,5 , 0,7] e, tale problema, si scarica nel calcolo dell’integrale di tale area.

Da tale esempio possiamo notare che la funzione di densità può assumere valori anche >1 in quanto

non restituisce una probabilità ma, bensì, una densità.

La funzione di densità gode di tre importanti proprietà:

1) f(x) ≥ 0 poiché l’integrale di una funzione negativa restituisce un valore negativo e quindi una

probabilità negativa;

2) l’area totale sottesa alla funzione è uguale a 1, ossia

+ ∞

∫ f(x) dx = 1

- ∞

3) Come già accennato, la probabilità che la v.c. continua X assuma uno specifico valore all’interno

dell’intervallo è 0 poiché ogni singolo valore corrisponde ad un intervallo di ampiezza 0, quindi la

corrispondente area è anch’essa 0.

La funzione di ripartizione, nel caso di v.c. continue, mantiene le stesse proprietà della funzione di

ripartizione della v.c. discreta con la differenza che non è una funzione a gradini ma continua, e

viene indicata con: x

∫ f(w)dw

F(x) = P(X ≤ x ) =

i - ∞

Esempio. Determinazione della probabilità associata ad intervalli conoscendo F(x).

f(x) P(a < x ≤ b)

0 x

P(a < x ≤ b) ?

F(a) = P(x ≤ a)

F(b) = P(x ≤ b)

Da come si può notare nessuna delle due funzioni di ripartizione corrisponde a ciò che cerchiamo,

tuttavia è possibile determinare la probabilità dell’intervallo [a, b] semplicemente come differenza

fra le due funzioni di ripartizione: P(a < x ≤ b) = F(b) - F(a)

P(x > b) ?

Qualora si richieda la probabilità di un intervallo maggiore a quello noto è possibile far uso della

proprietà che lega ad un evento il suo evento complementare, P(A) = 1 - P(A).

Di fatto, essendo per definizione l’area totale sottesa alla funzione = 1 è possibile determinare la

probabilità dell’intervallo > b come: P(x > b) = 1 - F(b)

Valore atteso e varianza di una variabile casuale

Come nella statistica descrittiva anche nella statistica inferenziale sono necessari valori che

sintetizzino le caratteristiche di una distribuzione. A tal proposito il valore atteso, E(x), di una

variabile casuale X è un modello che ci consente di sintetizzare le caratteristiche di una prova ed è

definito come: E(x) = ∑ x P(X = x ) se la v.c. è discreta

i i

+ ∞

∫

E(x) = x f(x)dx se la v.c. è continua

- ∞

In tale modello ciascun valore viene ridotto o esaltato in funzione della probabilità ed esprime il

valore che mediamente ci si aspetta di osservare. Ne deriva, quindi, che è analogo alla media

ponderata in cui i pesi sono le probabilità. Il valore atteso gode di due proprietà:

Anteprima

Vedrai una selezione di 9 pagine su 37