Statistica - Appunti

Appunti sono basati sulle lezioni di Statistica tenute dal professor Giovanni Maria Marchetti nell'a.a. 2013-2014, II semestre, all'interno dei cdl in Economia Aziendale e Economia e Commercio, …

Esame Statistica

Facoltà Economia

Dal corso del Prof. Marchetti Giovanni Maria

Università Università degli Studi di Firenze

Publisher Vix94

A.A. 2013-2014

25 pagine

10 download

Appunto

Vota 4,0 / 5 (3)

Scarica

Estratto del documento

C C

x n x

( )=

P x

DISTRIBUZIONE IPERGEOMETRICA N

C n

Distribuzioni congiunte di due variabili aleatorie discrete

Distribuzione di probabilità congiunta

Nella realtà si assiste a numerosi casi in cui è interessante studiare come due fenomeni, descritti da variabili

aleatorie, possano stabilire relazioni fra di loro.

Si definisce distribuzione di probabilità congiunta di due variabili aleatori X e Y, la probabilità che X assuma un

certo valore x e, congiuntamente, Y assuma un particolare valore y, come funzione di x e di y:

( )=P ( =x∩Y = )

P x , y X y

DISTRIBUZIONE CONGIUNTA

Distribuzione di probabilità marginale

Spesso è utile disporre delle funzioni di probabilità delle singole variabili, ovvero vedere come una singola

variabile si distribuisce congiuntamente all'altra: ∑ ∑

(x )= ( ( ( )

P P x , y) P y)= P x , y

DISTRIBUZIONE MARGINALE per X ; per Y

y x

Proprietà delle distribuzioni di probabilità congiunte

Sono due le proprietà importanti delle distribuzioni di probabilità congiunte:

(

• 0≤P x , y)≤1 per ogni coppia di valori di x e di y

• La somma delle probabilità congiunte su tutte le possibili coppie di valori deve valere 1

Distribuzione di probabilità condizionata (condizionate di riga o di colonna)

Si definisce distribuzione di probabilità condizionata di una variabile aleatoria, la distribuzione di una delle due

variabili, condizionata da un valore prefissato assunto dalla seconda variabile aleatoria.

Siano X e Y due variabili aleatorie di cui sia nota la distribuzione congiunta. La distribuzione della variabile Y,

subordinata a un valore x della variabile X, esprime la probabilità che Y assuma un valore y, come funzione di y:

P( x , y)

( )=

∣

P y x con P(x)>0

(

P x)

Stesso discorso si può fare per la distribuzione di probabilità condizionata di X dato Y=y, ovvero:

P( x , y)

(x )=

∣

P y con P(y)>o

( )

P y

Indipendenza di variabili aleatorie discrete

Due variabili aleatorie discrete X e Y distribuite congiuntamente sono dette indipendenti se e solo se la loro

distribuzione di probabilità congiunta è il prodotto delle distribuzioni di probabilità marginali, ovvero:

( )=P (x )∗P ( )

P x , y y per tutte le possibili coppie di valori x e y

Covarianza per le distribuzioni di probabilità congiunte

Come già introdotto, la covarianza è una misura della variabilità congiunta di due variabili aleatorie, ovvero una

misura della loro associazione lineare. µ µ

Siano X e Y due variabili aleatorie con medie rispettivamente e , si definisce la covarianza come:

x y

∑ ∑

)= ( µ )( µ ) [( µ )(Y µ )]

Cov( X ,Y x y P( x , y)=E X

COVARIANZA (variabili aleatorie) x y x y

x y

Formula che si può anche esprimere nella forma:

∑ ∑

)=E [ ] µ µ = ( ) µ µ

Cov( X ,Y XY xy∗P x , y

x y x y

x y

Correlazione fra variabile aleatorie congiunte

La covarianza fornisce una indicazione sulla direzione della relazione fra variabili aleatorie, ma può assumere

valori illimitati, in positivo o in negativo. Una misura più comoda per l'intensità della relazione lineare fra due

variabili è il coefficiente di correlazione lineare, come già detto:

)

Cov( X ,Y

ρ=Corr ( )=

X , Y

COEFF. DI CORR. ovvero il rapporto fra covarianza e gli s.q.m.

σ σ

x y

Il risultato è una misura standardizzata dell'intensità della relazione lineare, compresa fra -1 e 1. Come già

affrontato, in coefficiente di correlazione uguale a 0 indica che non c'è correlazione, un coefficiente di

correlazione positivo indica una correlazione positiva (direttamente proporzionale) e un coefficiente di

correlazione negativo indica una correlazione negativa (inversamente proporzionale).

In particolare, è l'indipendenza che implica l'incorrelazione e non viceversa: un coefficiente di correlazione pari

a 0 non implica per forza che le due variabili aleatorie siano indipendenti.

Combinazioni lineare di variabili aleatorie discrete

Si definisce combinazione lineare di due variabili aleatorie X e Y, una funzione che associa ad ogni valore

rispettivamente di X e di Y un risultato:

=aX +bY

W con a e b costanti prefissate

Si riportano alcune regole per somme e differenze fra variabili aleatorie, dove i coefficienti siano uguali a 1.

Siano X e Y due variabili aleatorie, valgono le seguenti proprietà:

( +Y )=µ +µ =E ( )+E (Y )

E X X

• →

valore atteso X Y

2 2

σ =σ +σ +2Cov( )

• X , Y

→

varianza (somma) ( +Y )

X X Y

2 2

σ =σ +σ )

• 2Cov( X , Y

→

varianza (differenza) ( )

X Y X Y

Nel caso che ci siano dei coefficienti moltiplicativi davanti alle variabili aleatorie, è necessario ricordarsi che:

(aX +bY )=a µ +b µ =aE ( )+bE (Y )

E X

• →

valore atteso X Y

2 2 2 2

σ =a σ +b σ ±2abCov ( )

• X , Y

→

varianza (aX ±bY ) X Y

Capitolo 6 – Distribuzioni di probabilità e variabili aleatorie continue

Variabili aleatorie continue

Calcolo della probabilità in un intervallo con la funzione di ripartizione

Richiamando il concetto di funzione di ripartizione, esposto in precedenza, sia X una variabile aleatoria continua

con funzione di ripartizione F(x) e siano a e b due possibili valori di X, ad esempio a<b. La probabilità che X

assuma valori fra a e b è allora:

(a< <b)= <b) ( <a)= (b) (a)

P X P( X P X F F ovvero la differenza fra le due f. di ripartizione

Funzione di densità di probabilità

Per le variabili aleatorie discrete abbiamo definito la funzione di probabilità come la funzione che associa ad

ogni valore discreto della variabile la relativa probabilità. Per le variabili aleatorie continue non si può definire

un concetto analogo, poiché la probabilità che si verifichi esattamente un valore appartenente ad un insieme

continuo è pari a 0. Per esse, è necessario definire la funzione di densità di probabilità, che permette di calcolare

la probabilità che il valore appartenga a un intervallo continuo, e ha un'utile rappresentazione grafica.

Sia X una variabile aleatoria continua e x un punto appartenente all'intervallo di valori che la variabile può

assumere, si definisce funzione di densità la funzione f(x) a cui è sottesa un'area in un intervallo fra due

valori a e b corrispondente alla probabilità che la variabile aleatoria continua assuma un valore compreso

nell'intervallo.

La funzione di densità di probabilità f(x) gode delle seguenti proprietà:

• f(x)>0 per qualunque x appartenente al campo di esistenza della funzione

• l'area sottesa alla funzione di densità in tutto il suo campo di esistenza è uguale a uno, ovvero:

+∞

∫ ( )

f x dx=1

∞

• la probabilità che X assuma un valore nell'intervallo compreso fra a e b, con a<b, è l'area sottesa dalla

∫

(a≤ ≤b)= (

P X f x) dx

funzione, limitatamente all'intervallo, ovvero: a

• la funzione di ripartizione F(x ) è l'area sottesa alla funzione di densità di probabilità f(x) fino a x :

0 0

x 0

∫

(x )= (

F f x)dx

0 ∞

Valore atteso di variabili aleatorie continue

Supponendo di trovarsi di fronte a un esperimento aleatorio il cui risultato sia rappresentato da una variabile

aleatoria continua X, effettuando un numero di ripetizioni tendente all'infinito, si definisce valore atteso di una

variabile aleatoria continua, la media dei valori assunti, ovvero:

+∞

∫

µ =E ( )= ( )dx

X x∗ f x

VALORE ATTESO x ∞

Varianza di variabili aleatorie continue

Sia X una variabile aleatoria continua, la sua varianza è il valore atteso del quadrato degli scarti della variabile

aleatoria dalla sua media, ovvero:

σ =E [(X µ ) ] 2 2 2

2 2 σ =E ( ) µ

X

VARIANZA oppure x x

x x

Lo scarto quadratico medio è sempre la radice quadrata della varianza.

Le proprietà di valore atteso e varianza solo le stesse giù trattate in precedenza.

Distribuzione uniforme

Un primo esempio di variabile aleatoria continua è la distribuzione uniforme. Una distribuzione uniforme è

caratterizzata da una funzione di probabilità costante in tutto il campo di esistenza considerato. La variabile

aleatoria assegna ad ogni intervallo una probabilità proporzionale alla sua lunghezza.

a+b

µ=

La media di una distribuzione uniforme definita fra due valori a e b è: 2

b a

σ =

La varianza è: 12

Distribuzione normale

La distribuzione di probabilità normale è la variabile aleatoria continua più utilizzata nelle applicazioni.

Questo perché:

• descrive bene numerosi fenomeni empirici

• ha proprietà matematiche convenienti

• il teorema fondamentale del limite garantisce che è un ottima approssimazione per campioni di grandi

dimensioni

La sua funzione di densità di probabilità ha una caratteristica forma campanulare, con delle “code” che si

allungano a più e meno infinito. L'asse di simmetria passa per la media, che coincide con la moda. La deviazione

standard è la distanza fra l'asse di simmetria e il punto di flesso sulla curva definita dalla funzione di densità.

Funzione di densità di probabilità della normale

La funzione di densità di probabilità della variabile aleatoria normale è:

(x µ)

1 σ 2

( )= ∗e 2

f x √ 2

π σ

La distribuzione normale, caratterizzata dalla conoscenza dei valori della media e della varianza, viene indicata

~ (µ )

X N ,σ

con una particolare notazione:

Calcolo della probabilità in un intervallo per la distribuzione normale

Sia X una variabile aleatoria normale, con funzione di ripartizione F(x) e a e b due possibili valori di X, con a<b,

la probabilità che la variabile assuma un valore compreso fra a e b sarà:

(a< <b)= (b) (

P X F F a) ovvero la differenza fra la funzione di ripartizione calcolata nei due estremi

Tuttavia il calcolo della probabilità relativa a un intervallo, ricorrendo alla funzione di ripartizione, e dunque al

Anteprima

Vedrai una selezione di 6 pagine su 25

Anteprima di 6 pagg. su 25.
Scarica il documento per vederlo tutto.

Scarica

Anteprima di 6 pagg. su 25.
Scarica il documento per vederlo tutto.

Scarica

Anteprima di 6 pagg. su 25.
Scarica il documento per vederlo tutto.

Scarica

Anteprima di 6 pagg. su 25.
Scarica il documento per vederlo tutto.

Scarica

Acquista con carta o PayPal

Scarica i documenti tutte le volte che vuoi

Dettagli

SSD

Scienze economiche e statistiche SECS-S/01 Statistica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher Vix94 di informazioni apprese con la frequenza delle lezioni di Statistica e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Firenze o del prof Marchetti Giovanni Maria.

Appunti correlati

Invia appunti e guadagna

Recensioni

4/5

3 recensioni

5 stelle

4 stelle

3 stelle

2 stelle

1 stella

Ti è piaciuto questo appunto?

Vip22

25 Aprile 2018

Ninkasi

25 Ottobre 2016

Serenasantoli

11 Luglio 2016

Statistica - Appunti

C C

DISTRIBUZIONE IPERGEOMETRICA N

DISTRIBUZIONE CONGIUNTA

E X X

X X Y

X Y X Y

E X

X

Recensioni

Domande e risposte

I migliori insegnanti di Matematica

Salvatore F.

Daniele P.

Matteo S.