Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
C C
x n x
( )=
P x
DISTRIBUZIONE IPERGEOMETRICA N
C n
Distribuzioni congiunte di due variabili aleatorie discrete
Distribuzione di probabilità congiunta
Nella realtà si assiste a numerosi casi in cui è interessante studiare come due fenomeni, descritti da variabili
aleatorie, possano stabilire relazioni fra di loro.
Si definisce distribuzione di probabilità congiunta di due variabili aleatori X e Y, la probabilità che X assuma un
certo valore x e, congiuntamente, Y assuma un particolare valore y, come funzione di x e di y:
( )=P ( =x∩Y = )
P x , y X y
DISTRIBUZIONE CONGIUNTA
Distribuzione di probabilità marginale
Spesso è utile disporre delle funzioni di probabilità delle singole variabili, ovvero vedere come una singola
variabile si distribuisce congiuntamente all'altra: ∑ ∑
(x )= ( ( ( )
P P x , y) P y)= P x , y
DISTRIBUZIONE MARGINALE per X ; per Y
y x
Proprietà delle distribuzioni di probabilità congiunte
Sono due le proprietà importanti delle distribuzioni di probabilità congiunte:
(
• 0≤P x , y)≤1 per ogni coppia di valori di x e di y
• La somma delle probabilità congiunte su tutte le possibili coppie di valori deve valere 1
Distribuzione di probabilità condizionata (condizionate di riga o di colonna)
Si definisce distribuzione di probabilità condizionata di una variabile aleatoria, la distribuzione di una delle due
variabili, condizionata da un valore prefissato assunto dalla seconda variabile aleatoria.
Siano X e Y due variabili aleatorie di cui sia nota la distribuzione congiunta. La distribuzione della variabile Y,
subordinata a un valore x della variabile X, esprime la probabilità che Y assuma un valore y, come funzione di y:
P( x , y)
( )=
∣
P y x con P(x)>0
(
P x)
Stesso discorso si può fare per la distribuzione di probabilità condizionata di X dato Y=y, ovvero:
P( x , y)
(x )=
∣
P y con P(y)>o
( )
P y
Indipendenza di variabili aleatorie discrete
Due variabili aleatorie discrete X e Y distribuite congiuntamente sono dette indipendenti se e solo se la loro
distribuzione di probabilità congiunta è il prodotto delle distribuzioni di probabilità marginali, ovvero:
( )=P (x )∗P ( )
P x , y y per tutte le possibili coppie di valori x e y
Covarianza per le distribuzioni di probabilità congiunte
Come già introdotto, la covarianza è una misura della variabilità congiunta di due variabili aleatorie, ovvero una
misura della loro associazione lineare. µ µ
Siano X e Y due variabili aleatorie con medie rispettivamente e , si definisce la covarianza come:
x y
∑ ∑
)= ( µ )( µ ) [( µ )(Y µ )]
Cov( X ,Y x y P( x , y)=E X
COVARIANZA (variabili aleatorie) x y x y
x y
Formula che si può anche esprimere nella forma:
∑ ∑
)=E [ ] µ µ = ( ) µ µ
Cov( X ,Y XY xy∗P x , y
x y x y
x y
Correlazione fra variabile aleatorie congiunte
La covarianza fornisce una indicazione sulla direzione della relazione fra variabili aleatorie, ma può assumere
valori illimitati, in positivo o in negativo. Una misura più comoda per l'intensità della relazione lineare fra due
variabili è il coefficiente di correlazione lineare, come già detto:
)
Cov( X ,Y
ρ=Corr ( )=
X , Y
COEFF. DI CORR. ovvero il rapporto fra covarianza e gli s.q.m.
σ σ
x y
Il risultato è una misura standardizzata dell'intensità della relazione lineare, compresa fra -1 e 1. Come già
affrontato, in coefficiente di correlazione uguale a 0 indica che non c'è correlazione, un coefficiente di
correlazione positivo indica una correlazione positiva (direttamente proporzionale) e un coefficiente di
correlazione negativo indica una correlazione negativa (inversamente proporzionale).
In particolare, è l'indipendenza che implica l'incorrelazione e non viceversa: un coefficiente di correlazione pari
a 0 non implica per forza che le due variabili aleatorie siano indipendenti.
Combinazioni lineare di variabili aleatorie discrete
Si definisce combinazione lineare di due variabili aleatorie X e Y, una funzione che associa ad ogni valore
rispettivamente di X e di Y un risultato:
=aX +bY
W con a e b costanti prefissate
Si riportano alcune regole per somme e differenze fra variabili aleatorie, dove i coefficienti siano uguali a 1.
Siano X e Y due variabili aleatorie, valgono le seguenti proprietà:
( +Y )=µ +µ =E ( )+E (Y )
E X X
• →
valore atteso X Y
2 2
σ =σ +σ +2Cov( )
• X , Y
→
varianza (somma) ( +Y )
X X Y
2 2
σ =σ +σ )
• 2Cov( X , Y
→
varianza (differenza) ( )
X Y X Y
Nel caso che ci siano dei coefficienti moltiplicativi davanti alle variabili aleatorie, è necessario ricordarsi che:
(aX +bY )=a µ +b µ =aE ( )+bE (Y )
E X
• →
valore atteso X Y
2 2 2 2
σ =a σ +b σ ±2abCov ( )
• X , Y
→
varianza (aX ±bY ) X Y
Capitolo 6 – Distribuzioni di probabilità e variabili aleatorie continue
Variabili aleatorie continue
Calcolo della probabilità in un intervallo con la funzione di ripartizione
Richiamando il concetto di funzione di ripartizione, esposto in precedenza, sia X una variabile aleatoria continua
con funzione di ripartizione F(x) e siano a e b due possibili valori di X, ad esempio a<b. La probabilità che X
assuma valori fra a e b è allora:
(a< <b)= <b) ( <a)= (b) (a)
P X P( X P X F F ovvero la differenza fra le due f. di ripartizione
Funzione di densità di probabilità
Per le variabili aleatorie discrete abbiamo definito la funzione di probabilità come la funzione che associa ad
ogni valore discreto della variabile la relativa probabilità. Per le variabili aleatorie continue non si può definire
un concetto analogo, poiché la probabilità che si verifichi esattamente un valore appartenente ad un insieme
continuo è pari a 0. Per esse, è necessario definire la funzione di densità di probabilità, che permette di calcolare
la probabilità che il valore appartenga a un intervallo continuo, e ha un'utile rappresentazione grafica.
Sia X una variabile aleatoria continua e x un punto appartenente all'intervallo di valori che la variabile può
assumere, si definisce funzione di densità la funzione f(x) a cui è sottesa un'area in un intervallo fra due
valori a e b corrispondente alla probabilità che la variabile aleatoria continua assuma un valore compreso
nell'intervallo.
La funzione di densità di probabilità f(x) gode delle seguenti proprietà:
• f(x)>0 per qualunque x appartenente al campo di esistenza della funzione
• l'area sottesa alla funzione di densità in tutto il suo campo di esistenza è uguale a uno, ovvero:
+∞
∫ ( )
f x dx=1
∞
• la probabilità che X assuma un valore nell'intervallo compreso fra a e b, con a<b, è l'area sottesa dalla
b
∫
(a≤ ≤b)= (
P X f x) dx
funzione, limitatamente all'intervallo, ovvero: a
• la funzione di ripartizione F(x ) è l'area sottesa alla funzione di densità di probabilità f(x) fino a x :
0 0
x 0
∫
(x )= (
F f x)dx
0 ∞
Valore atteso di variabili aleatorie continue
Supponendo di trovarsi di fronte a un esperimento aleatorio il cui risultato sia rappresentato da una variabile
aleatoria continua X, effettuando un numero di ripetizioni tendente all'infinito, si definisce valore atteso di una
variabile aleatoria continua, la media dei valori assunti, ovvero:
+∞
∫
µ =E ( )= ( )dx
X x∗ f x
VALORE ATTESO x ∞
Varianza di variabili aleatorie continue
Sia X una variabile aleatoria continua, la sua varianza è il valore atteso del quadrato degli scarti della variabile
aleatoria dalla sua media, ovvero:
σ =E [(X µ ) ] 2 2 2
2 2 σ =E ( ) µ
X
VARIANZA oppure x x
x x
Lo scarto quadratico medio è sempre la radice quadrata della varianza.
Le proprietà di valore atteso e varianza solo le stesse giù trattate in precedenza.
Distribuzione uniforme
Un primo esempio di variabile aleatoria continua è la distribuzione uniforme. Una distribuzione uniforme è
caratterizzata da una funzione di probabilità costante in tutto il campo di esistenza considerato. La variabile
aleatoria assegna ad ogni intervallo una probabilità proporzionale alla sua lunghezza.
a+b
µ=
La media di una distribuzione uniforme definita fra due valori a e b è: 2
2
b a
2
σ =
La varianza è: 12
Distribuzione normale
La distribuzione di probabilità normale è la variabile aleatoria continua più utilizzata nelle applicazioni.
Questo perché:
• descrive bene numerosi fenomeni empirici
• ha proprietà matematiche convenienti
• il teorema fondamentale del limite garantisce che è un ottima approssimazione per campioni di grandi
dimensioni
La sua funzione di densità di probabilità ha una caratteristica forma campanulare, con delle “code” che si
allungano a più e meno infinito. L'asse di simmetria passa per la media, che coincide con la moda. La deviazione
standard è la distanza fra l'asse di simmetria e il punto di flesso sulla curva definita dalla funzione di densità.
Funzione di densità di probabilità della normale
La funzione di densità di probabilità della variabile aleatoria normale è:
2
(x µ)
1 σ 2
( )= ∗e 2
f x √ 2
π σ
2
La distribuzione normale, caratterizzata dalla conoscenza dei valori della media e della varianza, viene indicata
~ (µ )
2
X N ,σ
con una particolare notazione:
Calcolo della probabilità in un intervallo per la distribuzione normale
Sia X una variabile aleatoria normale, con funzione di ripartizione F(x) e a e b due possibili valori di X, con a<b,
la probabilità che la variabile assuma un valore compreso fra a e b sarà:
(a< <b)= (b) (
P X F F a) ovvero la differenza fra la funzione di ripartizione calcolata nei due estremi
Tuttavia il calcolo della probabilità relativa a un intervallo, ricorrendo alla funzione di ripartizione, e dunque al