dimostrazioni statistica I

Appunti di statistica I con le dimostrazioni basati su appunti personali del publisher presi alle lezioni della prof. Polisicchio dell’università degli Studi di Milano Bicocca - …

Esame Statistica I

Facoltà Economia

Dal corso del Prof. Polisicchio Marcella

Università Università degli Studi di Milano - Bicocca

Publisher menguz

A.A. 2017-2018

4 pagine

Appunto

Vota 4,0 / 5 (1)

Scarica

Estratto del documento

I =X /X ,...,I =X /X -->I =I I ...I -->X /X =X /X X /X ...XJ-1/Xj-2*X /X .

2.1 2 1 j.j-1 j j-1 j.0 1.0 2.1 J.J-1 J 1 2 1 J J-1

0 0

Proprietà delle frequenze relative: 1) fr(aj)=n(aj)/n-->è sempre non negativa n(aj)≥0,n>0. 2)La somma delle

frequenze relative di una distribuzione è uguale a 1: fr +...+fr +...+fr(as)=1,[n +...+n +...+n(as)]/n=1,

(a1) (aj) (a1) (aj)

Σn(aj)/n=1, Σn(aj)=n .

Proprietà della media geometrica relativa ai logaritmi: La media geometrica dei logaritmi di N valori positivi è

1/N

pari al logaritmo della media geometrica degli N valori: log(M (x))=log([x *...*x *...*x ] )=1/N(log x +...+log

1 i N 1

xi+...+log x )=1/NΣlog xi-->log(M (x))=M1(log x).

N 0

Media aritmetica

1)Somma degli N scarti (xi-M1)=0--> Σ(Xi-M1)=ΣXi-ΣMi-->ΣX1-N*M1. Dal momento che

M1=1/NΣxi-->Σ(Xi-M1)=ΣXi-ΣXi=0.-->M1 è l'unico valore che annulla la somma degli scarti.

2)Somma del quadrato degli scarti delle xi da un valore A è minima per

2 2 2 2 2 2

A=M1-->Σ(xi-A) =Σ[xi-A-M1+M1] =Σ[(xi-M1)+(M1-A)] =Σ(Xi-M1) +N*(M1-A) +2(M1-A)Σ(xi-M1). Poiché N(A-M1)

2 2

è una quantità non negativa, risulta: Σ(xi-A) ≥Σ(xi-M1) .

3)La media aritmetica totale è uguale alla media aritmetica ponderata delle medie aritmetiche parziali, con pesi

pari alla proprietà dei gruppi (proprietà associativa)-->

1(J) 1(k) 1(j)

M1=(M N +…+M N +...+M N )/(N +...+N +...+N )=1/N ΣM N

1 1 j k 1 j k j.

4)Se fra i valori Y e quelli di X vi è una relazione lineare del tipo y ,allora fra la media aritmetica di Y e quella

i=a+b*xi

di X vi è la stessa relazione lineare--> M1(Y)=(1/N)Σa+b*xi--> M1(Y)=(1/N)Σa+(1/N)*bΣxi-->

M1(Y)=(1/N)*N*a+b*(1/N)Σxi-->M1(y)=a+b*M1(x).

Procedimento indiretto per il calcolo della devianza o della varianza:

2 2 2 2 2

Dev(X)=Σ(Xi-M1) =Σ(xi +M1 -2M1xi)=Σxi +ΣM1 -2M1Σxi. Poiché Σxi=N*M1, risulta:

2 2 2 2 2 2 2

Dev(X)=Σxi +NM1 -2M1*NM1-->Dev(x)=Σxi -NM1 da cui Var(X)= σ =1/NΣxi -M1 .

Proprietà Varianza 2 2 2 2 2

1) Se Y=a+bx, allora σ (Y)=b *σ (X); se Y=a+bx, allora M1(Y)=a+b*M1(X), per definizione σ (y)=1/NΣ(yi-M1(Y)) ,

2 2 2 2 2

per ipotesi yi=a+bxi e M1(y)=a+b*M1(X)-->[yi-M1(y)] =[a+bxi-a-bM1(X)] =[b(xi-M1(x))] =b *[xi-M1(x)] , -->

*σ

2 2 2 2 2 2 2

σ (Y)=1/NΣb *[xi-M1(X)] =b *1/NΣ[xi-M1(X)] = b (X).

2T 2j 2

2)Scomposizione della varianza totale: σ =1/NΣσ *N +1/NΣ x̄j

- x̄

) *N , la varianza totale si ottiene aggiungendo

j j

alla media ponderata delle varianze parziali la varianza fra le medie parziali. varianza totale=varianza nei gruppi

2T= 2N 2F 2j 2

+ varianza fra i gruppi: σ σ +σ = 1/NΣσ *N +1/NΣ x̄j -x̄

) *N

j j.

Proprietà dell'invarianza alle trasformazioni di scala del coefficiente di variazione: se la variabile non negativa

X è trasformata nella variabile non negativa Y con la trasformazione di scala y=bx (con b>0), allora

CV(y)=CV(x)-->M1(y)=b*M1(x) e σ(y)=b*σ(x)-->CV(y)=σ(y)/M1(y)=b*σ(x)/b*M1(x)=σ(x)/M1(x)=CV(X).

Espressione analitica di R:R è un rapporto fra aree: R= area di concentrazione/area di massima

concentrazione: R=[2/(N-1)]*(ΣPj-Σqj)=[2/(N-1)*[(N-1)/2 -Σqj]=1-[2/(N-1)Σqj].

I requisiti soddisfatti dal rapporto di concentrazione di Gini:

1)2) R=(Area di concentrazione/(Area Max concentrazione)

3)R(Y)=(Σyj*(2j-N-1))/(M1(Y)*N(N-1))=(Σa*xj(2j-N-1))/(aM1(X)*N(N-1))=(a/a)*((Σxj(2j-N-1))/(M1(X)*N(N-1))=R(X

)

4)R(Y)= ((Σh+xj)(2j-N-1))/(M1(h+X)*N(N-1))=(hΣ(2j-N-1)+ Σxj(2j-N-1))/(((h+M1(X))*N(N-1))

5)M1(X)=M1(Y) consegue che R(X) e R(Y) hanno lo stesso denominatore, confrontiamo i numeratori:

Σyi(2i-N-1)- Σxi(2i-N-1)= Σ(yi-xi)(2i-N-1).

Teorema M1=Me in caso di simmetria: se la distribuzione (x ,...x ,...x ) è simmetrica rispetto a M, allora

(1) (j) (N)

M=Me=M1. M=Me-->j=N/2 con N pari, (x -M)+(x -M)=0 da cui x +x =2M da cui

N/2) (N-(N/2)+1) N/2 (n/2)+1)

M=1/2[x +x ]-->M=Me; Con N dispari e j= N+1/2, (x +...x +...x )-N*M+(x +x +...+x )-N*M=0,

(N/2) ((N/2)+1) (1) (2) (N) (N) (jN-1) (1)

NM1+NM1=2NM-->2NM1=2NM-->M=M1-->M=Me=M1.

Proprietà della curva normale

1)la curva normale è simmetrica rispetto a X=A, scegliamo un c>0, dimostriamo che: f(x=A-c)=f(x=A+c), sapendo

^-1/2 (x-A/B)^2

che le ordinate della curva normale sono y=(1/B√2π) * e , sostituisco X=A-c e X=A+c. 1).f(x=A-c)=

^-1/2(A-c-A/B)^2 ^-1/2(c^2/B^2) ^-1/2(A+c-A/B)^2 ^-1/2(c^2/B^2)

(1/B√2π) * e = (1/B√2π) * e . 29. f(x=A+c)=(1/B√2π) * e = (1/B√2π) * e

--> f(x=A-c)=f(x=A+c), per il teorema sulla simmetria A coincide M1 e Me.

^-1/2(X-A/B)^2 1/2(X-A/B)^2

2)la moda della normale coincide con A, y=f(x)=(1/B√2π) * e = (1/B√2π) * (1/e . il massimo di

^1/2(X-A/B)^2 2

f(x) si ha in corrispondenza del minimo di e , cioè (X-A/B) =0.--> il massimo di f(x) si ha per x=A-->la

moda della normale coincide con A---> A=Mod(x). ^1/2(x-A/B)^2

3)Data la simmetria di f(x), basta analizzare il comportamento di f(x) al crescere di x. Se x-->infinito, e

tende a infinito e di conseguenza f(x) tende a 0. --> lim∞f(x)=lim -∞f(x)=0.

La soluzione dei parametri della retta interpolante a minimi quadrati: ἂ = media aritmetica ponderate degli n

coefficienti angolari pesati con (x x̄

) ἂ =intercetta della retta con coefficiente angolare ἂ e passante per il

i 1

punto (x̄

; ӯ).

Il procedimento indiretto per il calcolo della covarianza nel caso di N valori (xi, yi), i=1,…,N: è possibile

calcolare la codevianza senza l'utilizzo del prodotto degli (xi- x̄

)*(yi-ӯ) dagli scarti: Cod (X,Y)=Σ(xi-

x̄

)*(yi-ӯ)=Σ(xi*yi-xi*ӯ- x̄

*yi+ x̄

* ӯ)= Σxi*yi-ӯ Σxi- x̄Σyi+n x̄

* ӯ= Σxi*yi-n x̄

* ӯ, con il procedimento indiretto: COV

(X,Y)=1/n COD(X,Y)=1/nΣxi*yi- x̄

* ӯ.

Proprietà retta a minimi quadrati:

1)la somma delle ordinate effettive è uguale alla somma delle ordinate teoriche: Σyi=ŷi, sapendo che Σyi-ŷi=0

si ottiene: Σ(yi-ŷi)=0-->Σyi-ŷi=0, dalla prima proprietà si capisce che Mi(Y)-M (Y), cioè la media aritmetica delle

ordinate effettive è uguale alla medi aritmetica delle ordinate dell'interpolante.

2)la retta a minimi quadrati passa per il punto di coordinate (x̄

; ӯ), ӯ= ἂ + ἂ * x̄

. Dalla prima proprietà Σyi=ŷi, si

deduce che: Σyi=Σ(ἂ + ἂ *xi)-->Σyi=Σn* ἂ + ἂ *Σxi, dividendo per N da entrambe le parti si ottiene: ӯ= ἂ + ἂ * x̄

1 1 1

0 0 0

3)La covarianza fra la variabile residua Z e la variabile X è nulla: Cov(Z,X)=1/n Cod(Z,X)=1/n(Σ(zi-z)*(xi- x̄

)).

Ricordando che ż=0 e che zi=yi-ŷ, si ottiene: Cov (Z,X)=1/n Σ(yi-ŷi)*(xi- x̄

)=0, annulla le sommatorie Σ(yi-ŷi)=0 e

Σ(yi-ŷi)*(xi- x̄

)=0.

La scomposizione della devianza totale in devianza spiegata e devianza residua, nel caso

della retta interpolante a minimi quadrati: si verifica che (yi-ӯ)=(yi-ŷi)+(ŷi-ӯ), il quadrato dello scarto totale

2 2 2

risulta: (yi-ӯ) =(yi-ŷi) +(ŷi-ӯ) +2(yi-ŷi)(ŷi-ӯ), sommando tutti gli scarti totali al quadrato si ottiene:

2 2 2

Σ(yi-ӯ) =Σ(yi-ŷi) +Σ(ŷi-ӯi) +2Σ(yi-ŷi)*(ŷi-ӯi), sostituendo nell'ultima sommatoria L (xi- x̄

) al posto di (ŷi-ӯi) si ha:

2 2 2

2Σ(yi-ŷi)*L (xi- x̄

)=2L Σ(yi-ŷi)*(xi- x̄

). Otteniamo: Σ(yi-ӯi) =Σ(yi-ŷi) +Σ(ŷi-ӯi) . La devianza spiegata è uguale alla

1 1

somma del quadrato degli scarti spiegati, la devianza residua è uguale alla somma del quadrato degli scarti

residui-->D =D +D

T R S. 2d

La devianza spiegata in funzione del coefficiente angolare della retta a minimi quadrati: I =devianza

2 2 2 2 2

spiegata/devianza totale=Σ(ŷi-ӯi) /Σ(yi-ӯi) = Σ(ŷi-ӯi) /Σ(ŷi-ӯi) +Σ(yi+ŷi) . l'indice assume i valori [0;1]. l'indice

2 12

assume valore massimo+1 se D =0. l'indice assume valore min 0 se D =0, devianza spiegata= Σ(ŷi-ӯi) =L Σ(xi-

R S

2 12

x̄

) =L *DEV(X).

Relazione fra le frequenze relative marginali e le frequenze relative parziali: L frequenza relativa marginale

fr(bi) è uguale alla media aritmetica ponderata delle frequenze relative condizionate fr(bi/aj) con pesi pari alla

numerosità nj delle distribuzioni parziali.

fr(bi)=ni./N=ni1+...+nij+....+nic/N=[(ni1/n.1)*n.1+...+(nij/n.j)*n.j+...+(nic/n.c)*n.c]/N. Poiché ni1/n.1=fr(bi/a1)

risulta: fr(bi)=[fr(bi/a1)*n.1+...+fr(bi/aj)*n.j+...+fr(bi/ac)*n.c]/N---> fr(bi)=1/N Σfr(bi/aj)*n.j.

Uguaglianza delle frequenze marginali teoriche nel caso di indipendenza distributiva con le corrispondenti

frequenze marginali effettive: ň =ni.*n.j/N; ň=Σň --> ň =Σni.*n.j/N=ni./N Σn.j=(ni./N)*N=ni.--> ňi=ni.

ij ij i.

L’indipendenza distributiva implica l’indipendenza in media: se n =(n *n )/N-->allora ӯ =ӯ -->ӯ =(1/n j)Σyi*n ;

ij .j i. j j . ij

per l'ipotesi di indipendenza distributiva, risulta: ӯ (1/n j)Σyi*((n *n )/N)=((n /n )*N)Σyi*ni.=1/N Σyi*ni.=ӯ.

j= . .j i. .j .j

Il calcolo della covarianza in una tabella a doppia entrata attraverso le medie parziali di X o le medie parziali

di Y: Cod(X,Y)=ΣΣ(x x̄

)(y =Σ(x x̄)Σ(y . svolgendolo:

- -ӯ)*n - -ӯ)*n

j i ij j i ij

Σ(y Σy *n =ӯ n -ӯ*n =(ӯ -ӯ)*n.j-->Cod(X,Y)=Σ(xj- x̄

)(ӯ -ӯ)*n e Cov(X,Y)=1/NΣ(xj- x̄

)(ӯ -ӯ)*n

-ӯ)*n -ӯΣn .

i ij= i ij ij j. .j .j j j .j j .j

Proprietà della covarianza:

1)l'indipendenza distributiva implica che Cov(X,Y)=0, per ipotesi c'è indipendenza distributiva, ossia

n =(n *n )/N, Cov(X,Y)=1/NΣΣ(y )*n =1/NΣΣ(y )*(n *n /N)=1/NΣ(x x̄

)*n Σy , per la prima

-ӯ)(x -x̄ -ӯ)(x -x̄ - -ӯ)*n

ij .j i. i j .j i j i. .j j .j i i.

proprietà della media aritmetica le ultime due sommatorie sono uguali a 0-->Cov(X,Y)=0.

2)se uno dei due caratteri Y o X è indipendente in media dall'altro, allora Cov(Y,X)=0, Supponiamo che Y sia

indipendente in media da X: Cov(X,Y)=1/NΣ(x x̄

)(y =1/NΣ(x x̄

)*0*n =0.

- -ӯ)*n -

j j ij j .j

3)Se z =a+bxi e che w =c+dy allora Cov(Z,W)=bdCov(X,Y), è noto che z=

Anteprima

Vedrai una selezione di 1 pagina su 4

Acquista con carta o PayPal

Scarica i documenti tutte le volte che vuoi

Dettagli

SSD

Scienze economiche e statistiche SECS-S/01 Statistica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher menguz di informazioni apprese con la frequenza delle lezioni di Statistica I e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Milano - Bicocca o del prof Polisicchio Marcella.

Appunti correlati

Invia appunti e guadagna

Recensioni

4/5

1 recensione

5 stelle

4 stelle

3 stelle

2 stelle

1 stella

Ti è piaciuto questo appunto?

_Marikà_

15 Agosto 2022

dimostrazioni statistica I

I =X /X ,...,I =X /X -->I =I I ...I -->X /X =X /X X /X ...XJ-1/Xj-2*X /X .

M1=(M N +…+M N +...+M N )/(N +...+N +...+N )=1/N ΣM N

R S

Recensioni

Domande e risposte

I migliori insegnanti di Matematica

Salvatore F.

Daniele P.

Matteo S.

I =X /X ,...,I =X /X -->I =I *I *...*I -->X /X =X /X *X /X *...*XJ-1/Xj-2*X /X .

M1=(M *N +…+M *N +...+M *N )/(N +...+N +...+N )=1/N ΣM *N

R S

Recensioni

Domande e risposte

I migliori insegnanti di Matematica

Salvatore F.

Daniele P.

Matteo S.

I =X /X ,...,I =X /X -->I =I I ...I -->X /X =X /X X /X ...XJ-1/Xj-2*X /X .

M1=(M N +…+M N +...+M N )/(N +...+N +...+N )=1/N ΣM N