Che materia stai cercando?

Anteprima

ESTRATTO DOCUMENTO

Variabili casuali discrete e continue

Per descrivere fenomeni o esperimenti aleatori si considera la

nozione di variabile casuale, che fornisce un modello matematico

utile anche per le applicazioni statistiche.

Con le variabili casuali si opera in insiemi numerici dove le

probabilità si calcolano mediante somme o integrali.

Sono esempi di variabili casuali:

• l’esito del lancio di una moneta, indicando con 1 l’esito

“Testa” e con 0 l’esito “Croce”;

• il numero di abbinamenti (matches) tra le basi corrispondenti

in due sequenze di DNA di lunghezza n 1, scelte

casualmente da un database;

• il numero di giocate al superenalotto prima di vincere;

Statistica per la ricerca sperimentale e tecnologica - Parte 1, 2010-2011 — P. Vidoni 9/ 114

• il numero di oggetti che soddisfano ad opportuni standard di

qualità, tra quelli selezionati nell’ambito di una procedura di

controllo della qualità;

• la lunghezza effettiva di una barra di acciaio tagliata con un

macchinario soggetto ad errore non sistematico (accidentale).

Quindi una variabile casuale è un “oggetto” che, a seconda del

risultato dell’esperimento in esame, assume valori numerici a cui

possibile attribuire una certa probabilità di realizzazione.

Statistica per la ricerca sperimentale e tecnologica - Parte 1, 2010-2011 — P. Vidoni 10/ 114

Esempio. Moneta. Si consideri l’esperimento che consiste nel

lanciare tre volte una moneta regolare e si supponga di essere

interessati alla variabile casuale X che descrive il numero totale

degli esiti testa.

{CCC, }

L’insieme CCT, CT C, T CC, CT T, T CT, T T C, T T T

specifica gli esiti dell’esperimento. {0,

Quindi la variabile casuale X assume valori in 1, 2, 3} e tali

valori corrispondono a veri e propri eventi, indicati con la scrittura

simbolica X = i, i = 0, 1, 2, 3.

È immediato concludere che X = i ha probabilità 1/8, se i = 0, 3,

e 3/8, se i = 1, 2. Si noti che la somma delle probabilità riferite

agli esiti di X è pari a 1. ♦

Statistica per la ricerca sperimentale e tecnologica - Parte 1, 2010-2011 — P. Vidoni 11/ 114

∈ ⊆

La misura di probabilità riferita agli eventi X B, B R,

associati alla variabile casuale X, soddisfa gli assiomi di

Kolmogorov ed è detta distribuzione (legge) di probabilità di X.

Due variabili casuali X e Y sono dette identicamente distribuite, in

∼ ∈ ∈ ⊆

simboli X Y , se P (X B) = P (Y B), per ogni B R.

Per specificare la distribuzione di probabilità di una variabile

casuale X si considera la nozione di funzione di ripartizione, intesa

come un’applicazione F : R [0, 1], tale che

X ≤ ∈

F (x) = P (X x), x R.

X

La conoscenza di F permette di calcolare, eventualmente con

X ∈ ⊆

procedimenti di limite, tutte le probabilità P (X B), B R.

Statistica per la ricerca sperimentale e tecnologica - Parte 1, 2010-2011 — P. Vidoni 12/ 114

In particolare, per ogni a, b R, a < b,

≤ − −

P (a < X b) = F (b) F (a), P (X > a) = 1 F (a),

X X X

P (X = b) = F (b) lim F (x).

X X

x→b

La funzione di ripartizione verifica le tre seguenti proprietà

caratterizzanti:

• F è monotona non decrescente;

X

• F è continua da destra;

X

• F è tale che lim F (x) = 0 e lim F (x) = 1.

x→−∞ x→+∞

X X X

Perciò, F non è necessariamente continua anche da sinistra e

X

quindi continua in ogni punto.

Si può dimostrare che F è continua nei punti in cui

X

P (X = x) = 0 e discontinua nei punti in cui P (X = x) > 0, che

sono al più un’infinità numerabile.

Statistica per la ricerca sperimentale e tecnologica - Parte 1, 2010-2011 — P. Vidoni 13/ 114

Vengono riportati due esempi di funzioni di ripartizione.

0.8 0.8

0.4 0.4

0.0 0.0

−1 1 2 3 4 5 6 −1 1 2 3 4 5 6

L’insieme di tutti i possibili valori della variabile casuale X

corrisponde usualmente alla nozione di supporto.

Formalmente il supporto di X, indicato con S , è l’insieme dei

X

punti x R i cui intorni (intervalli centrati in x) sono eventi di

probabilità strettamente positiva.

Esempio. Moneta (continua). Si considera il lancio della moneta

{0,

ripetuto per tre volte. In questo caso, S = 1, 2, 3} e

X

P (X = 0) = P (X = 3) = 1/8, P (X = 1) = P (X = 2) = 3/8. ♦

Statistica per la ricerca sperimentale e tecnologica - Parte 1, 2010-2011 — P. Vidoni 14/ 114

Tra le varie tipologie di variabili casuali si considerano quelle

discrete, che possono assumere un numero finito o al più

numerabile di valori, e quelle continue, che assumono valori in un

insieme continuo.

Più precisamente, una variabile casuale X è discreta se esiste un

{x }

insieme di numeri reali , finito o al più numerabile, tale che

i i∈I

P {x ∈

P (X = x ) = p > 0 e p = 1; usualmente, S = , i I}.

i i i i

X

i∈I

La corrispondenza tra i possibili valori di X e le rispettive

probabilità individua la funzione di probabilità (massa)

∀i ∈

P (X = x ) = p se x = x , I,

i i i

f (x) =

X 0 altrimenti.

Dalla conoscenza di f si risale facilmente alla funzione di

X

ripartizione F e viceversa, quindi f caratterizza la variabile

X X

casuale X.

Statistica per la ricerca sperimentale e tecnologica - Parte 1, 2010-2011 — P. Vidoni 15/ 114

Infatti, per ogni x R, X

F (x) = P (X x) = p .

i

X ≤x

i: x i

Il grafico di F (x) è una funzione a gradini, continua da destra,

X ∈

con salti in corrispondenza degli elementi del supporto x S e

i X

ampiezza del salto data da −

p = f (x ) = F (x ) F (x ).

i i i i−1

X X X

La conoscenza di f permette spesso una notevole semplificazione

X

nel calcolo di probabilità di eventi relativi a X.

Statistica per la ricerca sperimentale e tecnologica - Parte 1, 2010-2011 — P. Vidoni 16/ 114

Esempio. Moneta (continua). Si considera la variabile casuale X

che conta il numero di esiti testa in tre lanci di una moneta

regolare. In questo caso, la funzione di probabilità e la funzione di

ripartizione corrispondono rispettivamente a

0.8 0.8

0.4 0.4

0.0 0.0

−1 0 1 2 3 4 −1 0 1 2 3 4

P

Inoltre, P (X 1) = P (X = x ) = 7/8. ♦

i

≥1

i : x i

Statistica per la ricerca sperimentale e tecnologica - Parte 1, 2010-2011 — P. Vidoni 17/ 114

Esempio. Variabile casuale degenere. Una variabile casuale X è

∈ ∼

degenere nel punto c R, in simboli X D(c), se P (X = c) = 1.

{c}

In questo caso S = e la funzione di ripartizione è

X 0 se x < c

F (x) =

X ≥

1 se x c,

con grafico, per il caso c = 1,

1.0

0.8

0.6

0.4

0.2

0.0 −1 0 1 2 3 4

Una variabile casuale degenere descrive un esperimento non

aleatorio. ♦

Statistica per la ricerca sperimentale e tecnologica - Parte 1, 2010-2011 — P. Vidoni 18/ 114

Esempio. Variabile casuale Bernoulliana. Una variabile casuale X

∼ ∈

è Bernoulliana, in simboli X Ber(p), con p (0, 1), se

{0, − ∈

S = 1} e P (X = 1) = p, P (X = 0) = 1 p, con p (0, 1).

X

Si ha che  0 se x < 0

 − ≤

1 p se 0 x < 1

F (x) =

X ≥

1 se x 1,

con grafico, per il caso p = 2/3,

1.0

0.8

0.6

0.4

0.2

0.0 −1 0 1 2 3 4

Descrive un esperimento aleatorio dicotomico, cioè con due

possibili esiti, ad esempio, successo e insuccesso, presenza e

assenza, ecc. quantificati in 1 e 0. ♦

Statistica per la ricerca sperimentale e tecnologica - Parte 1, 2010-2011 — P. Vidoni 19/ 114

Esempio. Tetano. Sia X una variabile casuale discreta che

descrive il numero di casi di tetano registrati nel comune di Padova

in una settimana. La sua funzione di ripartizione è

 0 se x < 0

 ≤

0.4 se 0 x < 1

 ≤

0.6 se 1 x < 2

F (x) =

X ≤

0.7 se 2 x < 3

 ≤

0.75 se 3 x < 4

 ≥

1 se x 4.

Si può calcolare −

P (X = 1) = F (1) F (0) = 0.2,

X X

P (X < 1) = F (1) P (X = 1) = 0.4 = F (0),

X X

− ≤ −

P (X > 2.5) = 1 P (X 2.5) = 1 F (2.5) = 0.3,

X

≤ −

P (0.5 < X 1.5) = F (1.5) F (0.5) = 0.2

X X ♦

Statistica per la ricerca sperimentale e tecnologica - Parte 1, 2010-2011 — P. Vidoni 20/ 114

Una variabile casuale X è continua se la sua funzione di

ripartizione F è continua ed è tale che esiste una funzione f ,

X X

definita su R, tale che x

Z ∀x ∈

F (x) = f (t)dt, R.

X X

−∞

La f è chiamata funzione di densità probabilità ed è tale che

X

• ≥ ∈

f (x) 0, per ogni x R;

X

+∞

R

• f (x)dx = 1;

X

−∞ d

• ∈

f F (x), per ogni x R in cui f (x) continua.

(x) = X X

X dx

Quindi dalla conoscenza di f si ottiene F e viceversa; f

X X X

caratterizza la variabile casuale X.

Il supporto S è un insieme continuo, ad esempio R o un

X

intervallo o una semiretta di R.

Statistica per la ricerca sperimentale e tecnologica - Parte 1, 2010-2011 — P. Vidoni 21/ 114

Nel caso delle variabili casuali continue, piuttosto che assegnare

probabilità a valori puntuali (si ricordi che, essendo F continua,

X

P (X = x) = 0, per ogni x R), si assegna probabilità agli

intervalli, semirette, ecc. di R.

≤ ∈

Gli eventi (X < a) e (x a), a R, hanno la stessa probabilità.

Nella figura sottostante si evidenzia come il valore della funzione di

ripartizione in x = 1, F (1), (grafico di sinistra) corrisponde

X

all’area sottesa dalla funzione di densità con riferimento alla

semiretta (−∞, 1] (grafico di destra).

0.8 0.8

0.4 0.4

0.0 0.0

−1 1 2 3 4 5 6 −1 1 2 3 4 5 6

Statistica per la ricerca sperimentale e tecnologica - Parte 1, 2010-2011 — P. Vidoni 22/ 114

Vale il seguente risultato: per ogni a, b R, a < b,

b

Z

≤ −

P (a < X b) = F (b) F (a) = f (x)dx,

X X X

a

che corrisponde all’area sottesa dalla funzione di densità con

riferimento all’intervallo [a, b]. Graficamente, se [a, b] = [1, 2],

0.8 0.8

0.4 0.4

0.0 0.0

−1 1 2 3 4 5 6 −1 1 2 3 4 5 6

Si noti che f non definisce la probabilità associata all’evento

X

X = x, che risulta essere nulla, ma è direttamente proporzionale

alla probabilità che X assuma valori in un intorno di x.

Statistica per la ricerca sperimentale e tecnologica - Parte 1, 2010-2011 — P. Vidoni 23/ 114

Esempio. Internet. Una compagnia telefonica ha riscontrato che

la durata, in un’ora, dei collegamenti internet dei propri utenti è

descritta da una variabile casuale continua X con funzione di

− ∈

densità f (x) = 6x(1 x), se x [0, 1], e nulla altrove.

X

Si verifica facilmente che f è non negativa e tale che

X

+∞

R ∈

f (x)dx = 1. Inoltre, per x [0, 1],

X

−∞ x x

Z Z 2 3

− −

F (x) = f (t)dt = 6t(1 t)dt = 3x 2x ;

X X

−∞ 0

mentre, se x < 0, F (x) = 0 e, se x > 1, F (x) = 1.

X X

La probabilità che X assuma valori in [0.5, 0.7] è

0.7

Z

≤ ≤ 6x(1−x)dx = 0.284

P (0.5 X 0.7) = F (0.7)−F (0.5) =

X X 0.5 ♦

Statistica per la ricerca sperimentale e tecnologica - Parte 1, 2010-2011 — P. Vidoni 24/ 114

Esempio. Variabile casuale esponenziale. Una variabile casuale X

è esponenziale, in simboli X Esp(λ), con λ > 0, se

S = [0, +∞) e

X −λx

λe se x S

X

f (x) =

X 0 altrimenti.

La funzione di ripartizione è

x x

Z Z

−λt −λt −λx

λe dt = λe dt = 1 e ,

F (x) =

X −∞ 0

∈ ∈

se x S , mentre F (x) = 0, se x / S .

X X X

Si calcolano le probabilità −λ

P (X > 1) = 1 F (1) = e ,

X −λ −3λ

≤ ≤ − −

P (1 X 3) = F (3) F (1) = e e ,

X X −1 −1 −3

che, se λ = 1, corrispondono rispettivamente a e e e e .

Statistica per la ricerca sperimentale e tecnologica - Parte 1, 2010-2011 — P. Vidoni 25/ 114

La variabile casuale esponenziale viene utilizzata soprattutto per

rappresentare durate e tempi di vita o di funzionamento, nel caso

in cui si ipotizza assenza di memoria o di usura.

1.2 1.2

0.6 0.6

0.0 0.0

−1 1 2 3 4 5 −1 1 2 3 4 5

Si presentano i grafici della funzione di ripartizione e della funzione

di densità nel caso λ = 1. ♦

Statistica per la ricerca sperimentale e tecnologica - Parte 1, 2010-2011 — P. Vidoni 26/ 114

Esempio. Variabile casuale uniforme. Una variabile casuale

continua X è uniforme in [0, 1], in simboli X U (0, 1), se

S = [0, 1] e

X ∈

1 se x S

X

f (x) =

X 0 altrimenti.

La funzione di ripartizione è  0 se x < 0

 ≤

x se 0 x < 1

F (x) =

X ≥

1 se x 1,

Si noti che, se gli intervalli [a, b] e [c, d] del supporto, con a < b e

c < d, hanno uguale ampiezza h, allora

≤ ≤ ≤ ≤ ·

P (a X b) = P (c X d) = h 1 = h.

Dunque, tutti gli intervalli del supporto di uguale lunghezza hanno

la stessa probabilità di contenere un valore di X.

Statistica per la ricerca sperimentale e tecnologica - Parte 1, 2010-2011 — P. Vidoni 27/ 114

La variabile casuale uniforme continua viene utilizzata per

esperimenti aleatori che possono essere rappresentati come

un’estrazione casuale di un numero da un certo intervallo di R.

È un modello che descrive l’equiprobabilità nel continuo.

1.0 1.0

0.0 0.0

−0.5 0.5 1.5 −0.5 0.5 1.5

Si presentano i grafici della funzione di ripartizione e della funzione

di densità. ♦

Statistica per la ricerca sperimentale e tecnologica - Parte 1, 2010-2011 — P. Vidoni 28/ 114

Indici di posizione e variabilità

La distribuzione di probabilità di una variabile casuale X viene

descritta in modo completo dalla associata funzione di ripartizione

o dalla corrispondente funzione (di densità) di probabilità.

Nonostante ciò, spesso si interessati a conoscere soltanto alcuni

aspetti parziali della distribuzione di probabilità di X, quali

• la posizione, cioè il centro della distribuzione di probabilità;

• la variabilità, cioè la dispersione della distribuzione di

probabilità attorno ad un centro;

• la forma della distribuzione di probabilità, considerando la

simmetria e la curtosi (pesantezza delle code).

Si riprendono sostanzialmente gli stessi concetti presentati in

Statistica descrittiva, modificando il contesto di applicazione e gli

elementi interpretativi.

Statistica per la ricerca sperimentale e tecnologica - Parte 1, 2010-2011 — P. Vidoni 29/ 114

Data una variabile casuale discreta o continua X, con supporto S

X

e funzione (di densità) di probabilità f , si chiama valore atteso

X

(medio) o media di X, in simboli E(X), la media dei suoi possibili

valori ponderati con le relative probabilità (la relativa funzione di

densità di probabilità), ovvero

X X

E(X) = xf (x) = xP (X = x), se X è discreta,

X

x∈S x∈S

X X

+∞

Z

E(X) = xf (x)dx, se X è continua,

X

−∞

purché la serie o l’integrale siano convergenti.

È l’indice di posizione più noto. Usualmente si pone E(X) = µ e si

intende tacitamente che tale valore atteso esista finito.

Statistica per la ricerca sperimentale e tecnologica - Parte 1, 2010-2011 — P. Vidoni 30/ 114

Esempio. La seguente tabella di frequenza sintetizza i voti

ottenuti da 30 alunni in un compito in classe.

voto 4 5 6 7 8

no. alunni 2 3 10 11 4

Si può calcolare la media aritmetica (Statistica descrittiva) che

corrisponde a 6.4.

Si supponga di avere un’urna con 30 palline, ciascuna contenente il

voto di un alunno, e si estragga a caso una pallina.

La variabile casuale X, che indica il voto ottenuto con l’estrazione,

ha distribuzione di probabilità

4 5 6 7 8

x

P (X = x) 2/30 3/30 10/30 11/30 4/30

e valore atteso E(X) = 6.4 (Calcolo delle probabilità). Il valore è

lo stesso, ma l’interpretazione è evidentemente diversa. ♦

Statistica per la ricerca sperimentale e tecnologica - Parte 1, 2010-2011 — P. Vidoni 31/ 114

Esempio. Si lancia una moneta che da testa con probabilità

p (0, 1); se esce testa Tizio paga a Caio un euro, se esce croce è

Caio a dover dare a Tizio la stessa somma.

Indicata con X la variabile casuale che descrive il guadagno di

− −

Tizio, si ha che E(X) = (−1)p + 1(1 p) = 1 2p.

Quindi, E(X) è positivo, nullo o negativo se, rispettivamente,

p < 1/2, p = 1/2 (moneta regolare) o p > 1/2. ♦

Esempio. Variabile casuale esponenziale (continua). Si consideri

la variabile casuale X Esp(λ). Poiché la funzione di densità è

nulla fuori dal supporto S = [0, +∞),

X

+∞ +∞ +∞

Z Z Z

1 1

−λx −t

E(X) = xf (x)dx = xλe dx = te dt = ,

X λ λ

−∞ 0 0

avendo operato il cambio di variabile t = λx e poi integrato per

parti. ♦

Statistica per la ricerca sperimentale e tecnologica - Parte 1, 2010-2011 — P. Vidoni 32/ 114

Esempio. Internet (continua). Si considera la variabile casuale X

che misura la durata, in un’ora, dei collegamenti internet degli

utenti di una certa compagnia telefonica. La funzione di densità di

− ∈

X è pari a f (x) = 6x(1 x), se x [0, 1], e nulla altrove.

X

Poiché la funzione di densità è nulla fuori dal supporto S = [0, 1],

X

1 1

Z Z 1

2 3

− − .

E(X) = x6x(1 x)dx = 6x 6x dx = 2

0 0 ♦

Esempio. Variabile casuale uniforme (continua). Si consideri la

variabile casuale X U (0, 1). Poiché la funzione di densità è nulla

fuori dal supporto S = [0, 1],

X 1

Z 1

·

E(X) = x 1 dx = .

2

0 ♦

Statistica per la ricerca sperimentale e tecnologica - Parte 1, 2010-2011 — P. Vidoni 33/ 114

Sia X una variabile casuale e Y = g(X) una variabile casuale

ottenuta come trasformata della X, tramite l’applicazione g(·).

Nota la distribuzione di probabilità di X, si può calcolare il valore

atteso di Y , ovvero E(Y ) = E(g(X)), senza conoscere la legge di

Y ; infatti, X

E(Y ) = g(x)f (x), se X e Y sono discrete,

X

x∈S

X

+∞

Z

E(Y ) = g(x)f (x)dx, se X e Y sono continue.

X

−∞

Sulla nozione di valore atteso si possono fare considerazioni

analoghe a quelle fatte in Statistica descrittiva con riferimento alla

media aritmetica.

Valgono inoltre le seguenti proprietà, per le quali si omettono le

dimostrazioni essendo sostanzialmente analoghe, per lo meno con

riferimento al caso discreto, a quelle viste per la media aritmetica:

Statistica per la ricerca sperimentale e tecnologica - Parte 1, 2010-2011 — P. Vidoni 34/ 114

∈ } ≤ ≤ ∈ }.

1) Proprietà di Cauchy: inf{x S E(X) sup{x S

X X

2) Proprietà di baricentro: E(X E(X)) = 0.

3) Proprietà di linearità: E(aX + b) = aE(X) + b, per ogni

a, b R.

Inoltre, si può dimostrare che vale la seguente estensione della

proprietà di linearità: date due variabili casuali X e Y , per ogni

a, b R E(aX + bY ) = aE(X) + bE(Y );

tale proprietà si può estendere anche al caso di combinazioni lineari

di più di due variabili casuali.

Oltre al valore atteso esistono altri indici di posizione. Tra questi

verranno ricordati la mediana e la moda.

Statistica per la ricerca sperimentale e tecnologica - Parte 1, 2010-2011 — P. Vidoni 35/ 114

La mediana della distribuzione di probabilità di X, o più

semplicemente la mediana di X, indicata con x , è quel valore

0.5

x R tale che

0.5 ≤ ≥ ≥ ≥

P (X x ) 1/2 e P (X x ) 1/2.

0.5 0.5

Quindi, x ripartisce la massa unitaria di probabilità, di modo che

0.5 ≤ ≥

gli eventi X x e X x abbiano probabilità pari a 1/2, o

0.5 0.5

anche maggiore di 1/2 se P (X = x ) > 0.

0.5

Può non essere unica e, in alcuni casi, può corrispondere anche ad

un intervallo di valori reali.

Se X è una variabile casuale continua, la mediana x è tale che

0.5

F (x ) = 1/2;

0.5

X

è il valore dove la funzione di ripartizione vale 1/2 e che ripartisce

a metà l’area unitaria sottesa dalla funzione di densità.

Statistica per la ricerca sperimentale e tecnologica - Parte 1, 2010-2011 — P. Vidoni 36/ 114

Esempio. Moneta (continua). Si consideri la variabile casuale X

che conta gli esiti testa in tre lanci di una moneta regolare.

≤ ≥ ≥ ≥

Le condizioni P (X x ) 1/2 e P (X x ) 1/2 risultano

0.5 0.5

verificate per x = 1, x = 2 e per ogni valore reale in (1, 2).

0.5 0.5

La variabile casuale X presenta come mediana tutti i valori

dell’intervallo [1, 2]. La mediana convenzionale è 1.5. ♦

{−2,

Esempio. Sia X una variabile casuale tale che S = 0, 1, 2},

X

−2)

P (X = = P (X = 2) = 1/4, P (X = 0) = 1/6 e

P (X = 1) = 1/3. Si ha allora che

≤ −2)

P (X 1) = P (X = + P (X = 0) + P (X = 1) > 1/2,

P (X 1) = P (X = 1) + P (X = 2) > 1/2.

Soltanto il valore x = 1 soddisfa le due condizioni della

0.5

definizione ed è quindi la mediana di X. ♦

Statistica per la ricerca sperimentale e tecnologica - Parte 1, 2010-2011 — P. Vidoni 37/ 114

Esempio. Variabile casuale esponenziale (continua). Si considera

la variabile casuale X Esp(λ), che ha funzione di ripartizione

−λx

− ≥

F (x) = 1 e , per x 0, e nulla altrove, con λ > 0.

X

La mediana di X si ottiene risolvendo l’equazione

−λx −1

1 e = 1/2. In particolare, si ha che x = λ log 2. ♦

0.5 0.5

Esempio. Internet (continua). Si considera la variabile casuale X

che misura la durata, in un’ora, dei collegamenti internet degli

utenti di una certa compagnia telefonica. La funzione di densità di

X è rappresentata nella figura sottostante.

1.5

1.0

0.5

0.0 −0.5 0.0 0.5 1.0 1.5

Poiché è simmetrica rispetto a x = 1/2, si ha che x = 1/2. ♦

0.5

Statistica per la ricerca sperimentale e tecnologica - Parte 1, 2010-2011 — P. Vidoni 38/ 114

La moda della distribuzione di probabilità di X, o più

semplicemente la moda di X, indicata con x , è quel valore

mo

x R per cui è massima la funzione (di densità) di probabilità.

mo

La moda non è necessariamente unica e può anche non esistere. Se

esiste, appartiene al supporto S e individua i valori più probabili,

X

se X discreta, o i cui intorni sono gli eventi più probabili, se X

continua.

Nel caso in cui f (x) ha un unico massimo, la distribuzione di

X

probabilità di X è detta unimodale; se ci sono due o più punti di

massimo, si parla di distribuzioni bimodali o multimodali.

Esempio. Internet (continua). Si considera la variabile casuale X

che misura la durata, in un’ora, dei collegamenti internet degli

utenti di una certa compagnia telefonica. Dalla analisi del grafico

della funzione di densità si conclude che x = 1/2. ♦

mo

Esempio. Tetano (continua). Sia X una variabile casuale discreta

che descrive il numero di casi di tetano registrati nel comune di

Statistica per la ricerca sperimentale e tecnologica - Parte 1, 2010-2011 — P. Vidoni 39/ 114

Padova in una settimana. Dalla analisi della funzione di massa

0.6

0.5

0.4

0.3

0.2

0.1

0.0 0 1 2 3 4

si conclude che x = 0. ♦

mo

Esempio. Variabile casuale esponenziale (continua). Si considera

la variabile casuale X Esp(λ). Dalla analisi del grafico della

funzione di densità si conclude che x = 0. ♦

mo

Esempio. Variabile casuale uniforme (continua). Si consideri la

variabile casuale X U (0, 1). Dalla analisi del grafico della

funzione di densità si conclude che la moda x corrisponde ad

mo

ogni punto dell’intevallo S = [0, 1]. ♦

X

Statistica per la ricerca sperimentale e tecnologica - Parte 1, 2010-2011 — P. Vidoni 40/ 114

Sia α (0, 1), si chiama quantile di livello α della distribuzione di

probabilità di X, o più semplicemente quantile di livello α di X,

indicato con x , quel valore x R tale che

α α

≤ ≥ ≥ ≥ −

P (X x ) α e P (X x ) 1 α.

α α

Quindi, a meno di effetti legati alla discretezza, x ripartisce la

α

massa unitaria di probabilità lasciando una porzione pari ad α alla

propria sinistra e pari a 1 α alla propria destra.

Può non essere unico e, in alcuni casi, può corrispondere anche ad

un intervallo di valori reali.

Se X è una variabile casuale continua, x è tale che

α

F (x ) = α;

α

X

è il valore dove la funzione di ripartizione vale α e che ripartisce in

due porzioni pari ad α e 1 α l’area unitaria sottesa dalla funzione

di densità.

Statistica per la ricerca sperimentale e tecnologica - Parte 1, 2010-2011 — P. Vidoni 41/ 114

Quindi la mediana corrisponde al quantile di livello α = 1/2. Se α

è espresso in termini decimali o percentuali e si parla allora di decili

o di percentili. Se α = 1/4, 1/2, 3/4, si hanno i quartili.

{−2,

Esempio. Sia X una variabile casuale tale che S = 0, 1, 2},

X

−2)

P (X = = P (X = 2) = 1/4, P (X = 0) = 1/6 e

P (X = 1) = 1/3. Si cerca il quantile di livello α = 0.4. Si ha che

≤ −2)

P (X 0) = P (X = + P (X = 0) > 0.4,

P (X 1) = P (X = 0) + P (X = 1) + P (X = 2) > 0.6.

Poiché soltanto il valore 0 soddisfa le due condizioni della

definizione, si conclude che x = 0. ♦

0.4

Esempio. Variabile casuale esponenziale (continua). Si considera

la variabile casuale X Esp(λ), che ha funzione di ripartizione

−λx

− ≥

F (x) = 1 e , per x 0, e nulla altrove, con λ > 0.

X

Statistica per la ricerca sperimentale e tecnologica - Parte 1, 2010-2011 — P. Vidoni 42/ 114

−λx

Il quantile x si ottiene risolvendo l’equazione 1 e = α. In

α

α −1

−λ −

particolare, si ha che x = log(1 α). ♦

α

Esempio. Internet (continua). Si considera la variabile casuale X

che misura la durata, in un’ora, dei collegamenti internet degli

utenti di una certa compagnia telefonica. La funzione di densità di

X è rappresentata nella figura sottostante.

1.5

1.0

0.5

0.0 −0.5 0.0 0.5 1.0 1.5

Poiché è simmetrica rispetto a x = 1/2, si si può concludere che,

per ogni α (0, 0.5), l’area della coda alla sinistra di x coincide

α

con l’area della coda alla destra di x . ♦

1−α

Statistica per la ricerca sperimentale e tecnologica - Parte 1, 2010-2011 — P. Vidoni 43/ 114

Data una variabile casuale discreta o continua X, con supporto S

X

e funzione (di densità) di probabilità f , si chiama varianza di X,

X

in simboli V (X), la quantità 2

V (X) = E((X E(X)) ),

se esiste finita, ovvero

X 2

(x E(X)) f (x), se X è discreta,

V (X) = X

x∈S

X

+∞

Z 2

V (X) = (x E(X)) f (x)dx, se X è continua,

X

−∞

purché la serie o l’integrale siano convergenti. 2

È l’indice di variabilità più noto. Usualmente si pone V (X) = σ e

si intende tacitamente che il valore atteso della definizione esista

finito.

Statistica per la ricerca sperimentale e tecnologica - Parte 1, 2010-2011 — P. Vidoni 44/ 114

La varianza è il valore atteso della variabile casuale scarto

X E(X) elevata al quadrato e misura la dispersione

distribuzione di probabilità attorno alla media.

Lo scarto quadratico medio di X, indicato con σ, è la radice

p

V (X).

quadrata aritmetica (l’unica positiva) della varianza, σ =

Valgono inoltre le seguenti proprietà, per le quali si omettono le

dimostrazioni essendo sostanzialmente analoghe a quelle viste per

la varianza in Statistica descrittiva: ≥

1) Proprietà di non negatività: V (X) 0, con V (X) = 0 se e

solo se X è degenere. 2 2

2) Formula per il calcolo: V (X) = E(X ) (E(X)) .

3) Proprietà di invarianza per traslazioni: V (X + b) = V (X),

b R.

4) Proprietà di omogeneità di secondo grado:

2 ∈

V (aX) = a V (X), a R.

Statistica per la ricerca sperimentale e tecnologica - Parte 1, 2010-2011 — P. Vidoni 45/ 114

2

Dalle proprietà 3) e 4) discende che V (aX + b) = a V (X), con

a, b R.

Inoltre, data una variabile casuale X, con media µ = E(X) e

2

varianza σ = V (X), la variabile casuale trasformata

X µ

Y = σ

è tale che E(Y ) = 0 e V (Y ) = 1 ed è detta variabile casuale

standardizzata.

Viceversa, a partire da una variabile casuale Y con E(Y ) = 0 e

V (Y ) = 1, si può ottenere una variabile casuale X, con valor

2

medio µ e varianza σ prefissati, utilizzando la trasformata

X = σY + µ.

Oltre alla varianza esistono altri indici di variabilità.

Statistica per la ricerca sperimentale e tecnologica - Parte 1, 2010-2011 — P. Vidoni 46/ 114

Se X è positiva, più precisamente se P (X > 0) = 1, si può

definire la quantità σ/µ, chiamata coefficiente di variazione.

Poiché non dipende dalla unità di misura con cui viene studiato il

fenomeno, può risultare utile per confrontare la dispersione di due

o più variabili casuali. −

Lo scarto interquartilico SI = x x , corrisponde alla

3/4 1/4

differenza tra il terzo e il primo quartile. ∈ } − ∈ },

Il campo di variazione (range) R = sup{x S inf{x S

X X

corrisponde sostanzialmente alla differenza tra il valore più grande

e più piccolo del supporto.

Per quanto riguarda lo studio della simmetria e della curtosi

(pesantezza delle code) di una distribuzione di probabilità si

possono riprendere le considerazioni fatte in Statistica descrittiva.

Statistica per la ricerca sperimentale e tecnologica - Parte 1, 2010-2011 — P. Vidoni 47/ 114

Esempio. Moneta (continua). Si considera la variabile casuale X

che conta il numero di esiti testa in tre lanci di una moneta

{0,

regolare. In questo caso, S = 1, 2, 3} e P (X = 0) =

X

P (X = 3) = 1/8, P (X = 1) = P (X = 2) = 3/8 ed è facile

verificare che 3 3 1 3

E(X) = 0 + 1 + 2 + 3 = ,

8 8 8 2

3 1

3

2 + 4 + 9 = 3.

E(X ) = 0 + 1 8 8 8 2

Con la regola per il calcolo, si ha V (X) = 3 (3/2) = 3/4. ♦

Esempio. Variabile casuale uniforme (continua). Si consideri la

variabile casuale X U (0, 1). Poiché E(X) = 1/2 e

1

Z 1

2 2 ·

E(X ) = x 1 dx = ,

3

0 2

si conclude che V (X) = 1/3 (1/2) = 1/12. ♦

Statistica per la ricerca sperimentale e tecnologica - Parte 1, 2010-2011 — P. Vidoni 48/ 114

Esempio. Variabile casuale esponenziale (continua). Si consideri

la variabile casuale X Esp(λ). Poiché E(X) = 1/λ e,

integrando per parti, +∞

+∞ Z

Z 2

2 −λx

−λx

2 2 λxe dx = ,

E(X ) = λx e dx = 2

λ λ

0

0 2 2 2

si conclude che V (X) = 2/λ (1/λ) = 1/λ . ♦

Esempio. Internet (continua). Si considera la variabile casuale X

che misura la durata, in un’ora, dei collegamenti internet degli

utenti di una certa compagnia telefonica. Poiché E(X) = 1/2 e

1 1

Z Z 3

2 2 3 2

− −

E(X ) = x 6x(1 x)dx = 6x 6x dx = ,

10

0 0

2

si conclude che V (X) = 3/10 (1/2) = 1/20. ♦

Statistica per la ricerca sperimentale e tecnologica - Parte 1, 2010-2011 — P. Vidoni 49/ 114

Modello uniforme discreto

Il modello uniforme discreto descrive esperimenti con un numero

finito di esiti equiprobabili.

Una variabile casuale X ha distribuzione uniforme discreta con

+

∈ ∈

possibili valori x , . . . , x R, n N fissato, in simboli

1 n

∼ {x }

X U d(x , . . . , x ), se S = , . . . , x e

1 n 1 n

X 1/n se x = x , . . . , x

1 n

f (x; x , . . . , x ) =

1 n

X 0 altrimenti

n n 2

P P −

Inoltre, E(X) = x /n, V (X) = (x E(X)) /n.

i i

i=1 i=1

Statistica per la ricerca sperimentale e tecnologica - Parte 1, 2010-2011 — P. Vidoni 50/ 114

Esempio. Si consideri il lancio di un dado regolare. La variabile

casuale X, che indica la faccia uscita dopo il lancio, ha

distribuzione di probabilità U d(6).

0.8 0.8

0.4 0.4

0.0 0.0

0 1 2 3 4 5 6 7 0 1 2 3 4 5 6 7

Le figure rappresentano le associate funzioni di probabilità e di

ripartizione di X. ♦

Statistica per la ricerca sperimentale e tecnologica - Parte 1, 2010-2011 — P. Vidoni 51/ 114

Modello binomiale

Si considerano esperimenti che possono essere rappresentati come

estrazioni con reinserimento da un’urna di composizione nota.

Ogni estrazione può essere classificata in due categorie

incompatibili ed esaustive chiamate, in modo convenzionale,

successo e insuccesso (osservazioni dicotomiche dove, in genere, 1

indica il successo e 0 l’insuccesso): esperimento bernoulliano.

Ogni estrazione è indipendente dalle altre e presenta la stessa

probabilità p (0, 1) di successo. ≥

Il modello binomiale descrive il numero di successi in n 1

esperimenti bernoulliani indipendenti con la stessa probabilità di

successo p (0, 1).

Una applicazione possibile è al controllo di qualità: si è interessati

al numero di elementi difettosi in un campione casuale di

≥ ∈

dimensione n 1, con p (0, 1) la porzione di elementi difettosi.

Statistica per la ricerca sperimentale e tecnologica - Parte 1, 2010-2011 — P. Vidoni 52/ 114

Un’altra applicazione è al contesto delle indagini di mercato: si è

interessati al numero di consumatori che apprezzano un certo

prodotto in un campione casuale di dimensione n 1, con

p (0, 1) la porzione di individui che apprezzano il prodotto.

Una ulteriore applicazione è allo studio delle popolazioni: si è

interessati al numero di individui che presentano un certa

caratteristica in un campione casuale di dimensione n 1, con

p (0, 1) la porzione di individui portatori della caratteristica.

Se, come spesso accade nel campionamento da popolazione finita,

si effettuano estrazioni senza reinserimento (estrazione in blocco),

si può comunque utilizzare il modello binomiale se la popolazione è

cosı̀ elevata da essere considerata quasi infinita.

In questo caso, ha poca importanza se l’estrazione è fatta con o

senza reinserimento.

Statistica per la ricerca sperimentale e tecnologica - Parte 1, 2010-2011 — P. Vidoni 53/ 114

Una variabile casuale X ha distribuzione binomiale di parametri

≥ ∈ ∼ {0,

n 1 e p (0, 1), in simboli X Bi(n, p), se S = . . . , n} e

X

n x n−x

− ∈

p (1 p) se x S

 X

x

f (x; n, p) =

X 0 altrimenti

dove n è il numero di prove indipendenti e p è la comune

x n−x

probabilità di successo; p (1 p) indica la probabilità di avere

x successi e n x insuccessi, in una specifica configurazione. Il

coefficiente binomiale

n −

= n!/[x!(n x)!]

x +

· − · · · · · ∈

dove k! = k (k 1) 3 2 1, con k N e 0! = 1, individua il

numero di possibili configurazioni con x successi.

Se n = 1 si ha una variabile casuale bernoulliana, o binomiale

elementare, in simboli Ber(p) o Bi(1, p).

Statistica per la ricerca sperimentale e tecnologica - Parte 1, 2010-2011 — P. Vidoni 54/ 114

Si considerano i grafici delle funzioni di massa nel caso in cui

n = 10 e p = 0.2, 0.5, 0.8 e n = 20 e p = 0.5.

n=10, p=0.2 n=10, p=0.5

0.4 0.4

0.2 0.2

0.0 0.0

0 2 4 6 8 10 0 2 4 6 8 10

n=10, p=0.8 n=20, p=0.5

0.4 0.4

0.2 0.2

0.0 0.0

0 2 4 6 8 10 0 5 10 15 20

Statistica per la ricerca sperimentale e tecnologica - Parte 1, 2010-2011 — P. Vidoni 55/ 114

Se le variabili casuali X Ber(p), i = 1, . . . , n, descrivono n

i

esperimenti bernoulliani indipendenti, si può concludere che la

n

P ∼

variabile casuale somma X = X Bi(n, p).

i

i=1

Si verifica facilmente che, per ogni i = 1, . . . , n,

· · −

E(X ) = 1 p + 0 (1 p) = p,

i 2 2

− −

V (X ) = E(X ) (E(X )) = p(1 p).

i i

i

Quindi, n n

X X

X ) = E(X ) = np,

E(X) = E( i i

i=1 i=1

n n

X X −

V (X) = V ( X ) = V (X ) = np(1 p).

i i

i=1 i=1

Infine, è facile verificare che la frequenza campionaria di successo

(media campionaria di bernoulliane) Y = X/n è tale che

E(Y ) = p e V (Y ) = p(1 p)/n.

Statistica per la ricerca sperimentale e tecnologica - Parte 1, 2010-2011 — P. Vidoni 56/ 114

Esempio. Tra i 100 iscritti ad una associazione sportiva ci sono 30

più alti di 180 cm. Si estrae casualmente un campione di n = 10

atleti con reinserimento.

La variabile casuale X che definisce il numero di atleti che, tra i 10

considerati, è più alto di 180 cm (successo) ha distribuzione

Bi(10, 0.3). Ci si attende di osservare E(X) = 3 atleti con altezza

superiore a 180 cm ed inoltre V (X) = 2.1

La probabilità di estrarre almeno un atleta più alto di 180 cm è

0 10

P (X 1) = 1−P (X = 0) = 1−[10!/(0!10!)]0.3 (1−0.3) = 0.97.

La probabilità di estrarre due atleti più alti di 180 cm è

2 8

P (X = 2) = [10!/(2!8!)]0.3 (1 0.3) = 0.23.

Infine, la probabilità di estrarne meno di 4 è

Statistica per la ricerca sperimentale e tecnologica - Parte 1, 2010-2011 — P. Vidoni 57/ 114

3

X

P (X < 4) = P (X = x ) = 0.27 + 0.23 + 0.12 + 0.03 = 0.65.

i

i=0 ♦

Esempio. Un antibiotico riesce a distruggere una colonia batterica

una volta su dieci. Si ripete l’esperimento su n = 50 colture

batteriche.

La variabile casuale X che descrive il numero di colture batteriche

che, tra le cinquanta considerate, verranno distrutte è una

Bi(50, 0.1).

Il numero atteso di colture distrutte è E(X) = 5, mentre

V (X) = 4.5. Inoltre, la probabilità che almeno una coltura sia

distrutta è 0 50

P (X 1) = 1−P (X = 0) = 1−[50!/(0!50!)]0.1 (1−0.1) = 0.995.

Statistica per la ricerca sperimentale e tecnologica - Parte 1, 2010-2011 — P. Vidoni 58/ 114

Modello Poisson

Il modello Poisson descrive problemi di conteggio quando non c’è

una limitazione superiore per il supporto o problemi in cui tale

limitazione è praticamente irrilevante.

Sotto alcune ipotesi, descrive il numero di arrivi o accadimenti di

un evento di interesse (successo) in un intervallo di tempo (o

anche su una superficie) di dimensione fissata.

Una variabile casuale X ha distribuzione Poisson con parametro

λ > 0, in simboli X P (λ), se S = N e

X

−λ

x

λ e /x! se x S

X

f (x; λ) =

X 0 altrimenti

2 2

Si dimostra che E(X) = λ e E(X ) = λ + λ, da cui si ottiene

2 2 2 2

− −

che V (X) = E(X ) (E(X)) = λ + λ λ = λ. Quindi, media

e varianza coincidono e corrispondono al parametro λ.

Statistica per la ricerca sperimentale e tecnologica - Parte 1, 2010-2011 — P. Vidoni 59/ 114


PAGINE

114

PESO

1.08 MB

PUBBLICATO

+1 anno fa


DESCRIZIONE DISPENSA

La dispensa fa riferimento alle lezioni di Statistica per la ricerca sperimentale e tecnologia, tenute dal Prof. Paolo Vidoni, nell'anno accademico 2011.
Il documento spiega la variabili casuali e il campionamento.
Tra gli argomenti chiave: variabilità campionaria, inferenza statistica, stime, regressione lineare.


DETTAGLI
Corso di laurea: Corso di laurea in tecniche di radiologia medica per immagini e radioterapia
SSD:
Università: Udine - Uniud
A.A.: 2011-2012

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher lenlauret di informazioni apprese con la frequenza delle lezioni di Statistica per la ricerca sperimentale e tecnologica e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Udine - Uniud o del prof Vidoni Paolo.

Acquista con carta o conto PayPal

Scarica il file tutte le volte che vuoi

Paga con un conto PayPal per usufruire della garanzia Soddisfatto o rimborsato

Recensioni
Ti è piaciuto questo appunto? Valutalo!

Altri appunti di Statistica per la ricerca sperimentale e tecnologica

Tavole statistiche - Parte prima
Dispensa
Statistica per la ricerca sperimentale - Calcolo delle probabilità
Esercitazione
Tavole statistiche - Parte seconda
Dispensa
Statistica per la ricerca sperimentale - Inferenza statistica
Esercitazione