Anteprima
Vedrai una selezione di 10 pagine su 43
Statistica Pag. 1 Statistica Pag. 2
Anteprima di 10 pagg. su 43.
Scarica il documento per vederlo tutto.
Statistica Pag. 6
Anteprima di 10 pagg. su 43.
Scarica il documento per vederlo tutto.
Statistica Pag. 11
Anteprima di 10 pagg. su 43.
Scarica il documento per vederlo tutto.
Statistica Pag. 16
Anteprima di 10 pagg. su 43.
Scarica il documento per vederlo tutto.
Statistica Pag. 21
Anteprima di 10 pagg. su 43.
Scarica il documento per vederlo tutto.
Statistica Pag. 26
Anteprima di 10 pagg. su 43.
Scarica il documento per vederlo tutto.
Statistica Pag. 31
Anteprima di 10 pagg. su 43.
Scarica il documento per vederlo tutto.
Statistica Pag. 36
Anteprima di 10 pagg. su 43.
Scarica il documento per vederlo tutto.
Statistica Pag. 41
1 su 43
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

La covarianza

La covarianza è data da: Cov(X, Y) = E[(X - μ)(Y - μ)] = σX, Y Nel caso di variabili casuali discrete, la formula per il calcolo della covarianza è: Cov(X, Y) = ΣΣ[(Xi - μX)(Yj - μY)] * pXY(i, j) La covarianza riguarda l'associazione fra X e Y. Essa è il valore atteso del prodotto degli scarti per gli scarti. Se vi è con maggiore probabilità una concordanza nel segno degli scarti, la covarianza è positiva; altrimenti, se vi è discordanza, la covarianza è negativa. In particolare, è possibile dimostrare che se esiste dipendenza lineare fra le variabili, la covarianza ne individua il segno. Essa è positiva se all'aumentare della X aumenta anche la Y ed è invece negativa se all'aumentare della X la Y decresce. Una formula alternativa per il calcolo della covarianza è la seguente: Cov(X, Y) = E[XY] - μXμY

XY X Yk h∑ ∑=E[ ]μ XY =μ x y pdove è il valore atteso del prodotto XYXY XY i i iji=1 j=1

La covarianza ha alcune proprietà cui è opportuni riferirsi per interpretare correttamente il valore che essa assume. Esse sono:

proprietà 1se X e Y sono indipendenti la covarianza è nulla

proprietà 2date due variabili casuali X e Y, la covarianza fra le trasformazioni lineari aX+b e cY+dè data da Cov (aX+b, cY+d) = acCov (X, Y)

Proprietà 3Disuguaglianza di Cauchy-Schwarz: la covarianza fra due variabili casuali X e Y, in valore assoluto, è al massimo uguale al prodotto degli scarti quadratici medi

Coefficiente di correlazioneUn indice dell’intensità del legame lineare fra due variabili X e Y è il coefficiente di ρ correlazione, indicato con oppure con Corr(X, Y). Esso è dato dal valore atteso XY del prodotto delle variabili standardizzate( )( )−μ −μX YX Y( )=E=Corr [ ]ρ X , YXY

σ σX Ye può anche essere calcolato come rapporto fra covarianza e il prodotto degli scartiσ XYquadratici medi .σ σX YIl coefficiente di correlazione gode di alcune importanti proprietà da tenere presentiper interpretare correttamente il suo valore. Esse sono:

proprietà 1: il coefficiente di correlazione assume valore nell’intervallo [-1, 1]

proprietà 2: il valore assoluto del coefficiente di correlazione è uguale a 1, quando fraXYla X e la Y esiste un perfetto legame lineare

proprietà 3: se le variabili X e Y sono indipendenti il coefficiente di correlazione è nullo

proprietà 4: il coefficiente di correlazioni è invariante, a meno del segno, rispetto alletrasformazioni lineari, cioè± ρCorr (aX+b,cY+d)= XYCombinazioni lineari di variabili casualiData una coppia di variabili casuali (X, Y), una combinazione lineare è una

particolare funzione di X e Y data da aX+bY. Ad esempio, se a=b=1 la combinazione lineare è la somma X+Y, mentre se a=1 e b=-1 si ottiene X-Y. Il valore atteso di una combinazione lineare è dato dalla combinazione lineare del valore atteso. La varianza di una combinazione lineare è invece data da

(a^2 * Var(X)) + (b^2 * Var(Y)) + (2ab * Cov(X,Y))

Se le variabili casuali sono incorrelate si ha Var(aX + bY) = (a^2 * Var(X)) + (b^2 * Var(Y))

Combinazioni lineari di n variabili casuali

Var(a1X1 + a2X2 + ... + anXn) = a1^2 * Var(X1) + a2^2 * Var(X2) + ... + an^2 * Var(Xn)

Modelli per variabili casuali discrete

Variabile casuale di Bernoulli

Molti esperimenti hanno due soli esiti possibili interpretabili come "successo" oppure "insuccesso". Sia la probabilità del successo, dove 0 ≤ π ≤ 1. La variabile casuale di Bernoulli X assume valore 1 quando si verifica un successo e zero quando si verifica un insuccesso. La sua distribuzione di probabilità dipende dal parametro π, infatti

=1−π ( )=πP X=0 , P X=1 ( )X Ber π

Per indicare che X ha una distribuzione di Bernoulli si utilizza la notazione x 1− x( )=π

La funzione di probabilità risulta (P X=x 1−π)[ ] =0∗( ) +1∗π =π

E X 1−π => la media2 2( )=(0−π ∗( )+ ( ) => la varianza) ∗π=π (1−π )Var X 1−π 1−π

Variabile casuale binomiale

Si consideri un esperimento con risultato dicotomico e si supponga di eseguire n prove.indipendente, in modo tale che la probabilità di successo sia costante e a pari a La variabile casuale X che descrive il numero di successi nelle n prove ha una(n )X B , πdistribuzione binomiale

La variabile casuale binomiale è una variabile casuale discreta che assume valori interifra zero e n.π1−¿¿π1−¿¿ n x( )= ¿P X=x πx

Modelli per variabili casuali continue

In molte circostanze è ragionevole

Ipotizzare che la variabile casuale, che descrive un fenomeno di interesse, assuma con probabilità elevata valori intorno alla media e inoltre assuma valori in intervalli di ampiezza fissata con probabilità che decresce quando l'intervallo si allontana dalla media.

Una variabile casuale continua X, che assume valori nell'insieme dei numeri reali, è normale se la sua funzione di densità è

2(x - μ) / σ2 √(2πσ)

dove μ e σ sono due parametri tali che -∞ < μ < +∞ e σ > 0. È possibile dimostrare che μ e σ sono rispettivamente la media e la varianza di X.

Per indicare che una variabile casuale X è distribuita in modo normale, con media μ e varianza σ, si utilizza la notazione X ~ N(μ, σ2).

La funzione di densità di una variabile casuale normale ha forma campanulare.

ed è centrata sulla media.

Funzione di densità di una variabile casuale normale

Funzione di densità di variabili casuali normali stessa varianza e diversa media

Funzione di densità di variabili casuali normali con diverse varianze e stessa media

Funzione di ripartizione di una variabile casuale normale

Una variabile casuale normale standardizzata Z ha media nulla e varianza unitaria, (0,1)Z N . La sua funzione di densità è -11 2z2( )=Φ z √ 2 π ( )=P(ZΦ z ≤ z)

La funzione di ripartizione di Z si indica con ed è tabulata per valori di z non negativi. ϕ

Utilizzando la tavola di (z) è possibile calcolare le probabilità che Z assuma valore P( Z ≥ z) in una qualsiasi regione dell’asse reale. Infatti, la probabilità, per z positivo, Φ(z) è l’area sotto a destra di z. Poiché l’area sotto la funzione di densità vale 1, P( Z ≥ z) è data dal complemento a 1.

della funzione di ripartizione( )=1-Φ( )P(Z ≥ z)z

La variabile casuale normale gode della proprietà riproduttiva: combinazioni lineari di variabili casuali normali indipendenti generano variabili casuali la cui distribuzione è ancora normale.

Variabile casuale uniforme θ(θ),

La variabile casuale uniforme assume valori in un intervallo è costante nell’intervallo. θ(θ)XU, θ1 2θ ≤ x ≤ θ e è nulla altrove. 1 2θ θ 2+ (θ -θ)1 2[ ] 2 1= , E X ( )=Var X2 12 θ(θ), La media coincide con il valore centrale dell’intervallo. Infine, la funzione di ripartizione è x-θ 1( )=Fx θ -θ2 1

Variabile casuale chi-quadrato Z, Z, … , Z (0,1) Z N Siano n variabili casuali normali standardizzate, e i1 2 n indipendenti. La variabile casuale n∑ 2=X Zi i=1 2 Ha una distribuzione

(chi-quadrato) con n grandi di libertà χ2X χ n

Il valore atteso e la varianza dipendono dai gradi di libertà e sono dati da E[X]=n, Var(X)=2n

Variabile casuale t di Student 2

Sia Z una variabile casuale normale standardizzata e Y una variabile casuale , fra nloro indipendenti. La variabile casuale Z=X √/nY X tha una distribuzione t di Student con n gradi di libertà n

La variabile casuale t di Student assume valori reali e ha una distribuzione simmetrica intorno allo zero.

Teorema del limite

Il teorema del limite centrale dimostra che la distribuzione della media o della somma di n variabili casuali indipendenti tende alla distribuzione di una variabile casuale normale quando n diventa infinitamente grande. Si consideri una successione di [ ] 2( )=μX , X ,… , X ,… E X =σVar X variabili casuali indipendenti e tali che e1 2 n i 1X́per qualunque i. Si indichi con la media delle prime n variabili casuali n1 ∑=X́ Xn in i=1 Tuttavia, se

le casuale normale standardizzata
Dettagli
Publisher
A.A. 2021-2022
43 pagine
SSD Scienze economiche e statistiche SECS-S/01 Statistica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher _Erika2000 di informazioni apprese con la frequenza delle lezioni di Statistica e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Libera Università internazionale degli studi sociali Guido Carli - (LUISS) di Roma o del prof Cubadda Gianluca.