Anteprima
Vedrai una selezione di 1 pagina su 5
Dimostrazioni statistica I Pag. 1
1 su 5
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

M1=(M *N +…+M *N +...+M *N )/(N +...+N +...+N )=1/N ΣM *N

1 1 j k 1 j k j.

4)Se fra i valori Y e quelli di X vi è una relazione lineare del tipo y ,allora fra la media

i=a+b*xi

aritmetica di Y e quella di X vi è la stessa relazione lineare --> M1(Y)=(1/N)Σa+b*xi-->

M1(Y)=(1/N)Σa+(1/N)*bΣxi--> M1(Y)=(1/N)*N*a+b*(1/N)Σxi-->M1(y)=a+b*M1(x).

Procedimento indiretto per il calcolo della devianza o della varianza:

2 2 2 2 2

Dev(X)=Σ(Xi-M1) =Σ(xi +M1 -2M1xi)=Σxi +ΣM1 -2M1Σxi. Poiché Σxi=N*M1, risulta:

2 2 2 2 2 2 2

Dev(X)=Σxi +NM1 -2M1*NM1-->Dev(x)=Σxi -NM1 da cui Var(X)= σ =1/NΣxi -M1 .

Proprietà Varianza

1) 2 2 2

Se Y=a+bx, allora σ (Y)=b *σ (X); se Y=a+bx, allora M1(Y)=a+b*M1(X), per

2 2

definizione σ (y)=1/NΣ(yi-M1(Y)) , per ipotesi yi=a+bxi e M1(y)=a+b*M1(X)-->[yi-

2 2 2 2 2 2 2

M1(y)] =[a+bxi-a-bM1(X)] =[b(xi-M1(x))] =b *[xi-M1(x)] , --> σ (Y)=1/NΣb *[xi-

2 2 2

M1(X)] =b *1/NΣ[xi-M1(X)] 2 2

= b *σ (X).

2) 2T 2j 2

Scomposizione della varianza totale: σ =1/NΣσ *N +1/NΣ xx̄ j- xx̄ ) *N , la varianza totale si

j j

ottiene aggiungendo alla media ponderata delle varianze parziali la varianza fra le medie

2T= 2N 2F

parziali. varianza totale=varianza nei gruppi + varianza fra i gruppi: σ σ +σ =

2j 2

1/NΣσ *N +1/NΣ xx̄ j-xx̄ ) *N

j j.

Proprietà dell'invarianza alle trasformazioni di scala del coefficiente di

variazione : se la variabile non negativa X è trasformata nella variabile non negativa Y

con la trasformazione di scala y=bx (con b>0), allora CV(y)=CV(x)-->M1(y)=b*M1(x) e

σ(y)=b*σ(x)-->CV(y)=σ(y)/M1(y)=b*σ(x)/b*M1(x)=σ(x)/M1(x)=CV(X).

Espressione analitica di R:R è un rapporto fra aree: R= area di

concentrazione/area di massima concentrazione: R=[2/(N-1)]*(ΣPj-Σqj)=[2/(N-

1)*[(N-1)/2 -Σqj]=1-[2/(N-1)Σqj].

I requisiti soddisfatti dal rapporto di concentrazione di Gini:

1)2) R=(Area di concentrazione/(Area Max concentrazione)

3)

R(Y)=(Σyj*(2j-N-1))/(M1(Y)*N(N-1))=(Σa*xj(2j-N-1))/(aM1(X)*N(N-1))=(a/a)*((Σxj(2j-N-

1))/(M1(X)*N(N-1))=R(X)

4)

R(Y)= ((Σh+xj)(2j-N-1))/(M1(h+X)*N(N-1))=(hΣ(2j-N-1)+ Σxj(2j-N-1))/(((h+M1(X))*N(N-

1))

5)

M1(X)=M1(Y) consegue che R(X) e R(Y) hanno lo stesso denominatore, confrontiamo i

numeratori: Σyi(2i-N-1)- Σxi(2i-N-1)= Σ(yi-xi)(2i-N-1).

Teorema M1=Me in caso di simmetria : se la distribuzione (x ,...x ,...x ) è

(1) (j) (N)

simmetrica rispetto a M, allora M=Me=M1. M=Me-->j=N/2 con N pari, (x -M)+(x -

N/2) (N-(N/2)+1)

M)=0 da cui x +x =2M da cui M=1/2[x +x ]-->M=Me; Con N dispari e j=

N/2 (n/2)+1) (N/2) ((N/2)+1)

N+1/2, (x +...x +...x )-N*M+(x +x +...+x )-N*M=0, NM1+NM1=2NM--

(1) (2) (N) (N) (jN-1) (1)

>2NM1=2NM-->M=M1-->M=Me=M1.

Proprietà della curva normale

1)

la curva normale è simmetrica rispetto a X=A, scegliamo un c>0, dimostriamo che: ^-1/2

f(x=A-c)=f(x=A+c), sapendo che le ordinate della curva normale sono y=(1/B√2π) * e

(x-A/B)^2 ^-1/2(A-c-A/B)^2 ^-

, sostituisco X=A-c e X=A+c. 1).f(x=A-c)= (1/B√2π) * e = (1/B√2π) * e

1/2(c^2/B^2) ^-1/2(A+c-A/B)^2 ^-1/2(c^2/B^2)

. 29. f(x=A+c)=(1/B√2π) * e = (1/B√2π) * e --> f(x=A-

c)=f(x=A+c), per il teorema sulla simmetria A coincide M1 e Me.

2) ^-1/2(X-A/B)^2

la moda della normale coincide con A, y=f(x)=(1/B√2π) * e = (1/B√2π) *

1/2(X-A/B)^2 ^1/2(X-A/B)^2

(1/e . il massimo di f(x) si ha in corrispondenza del minimo di e , cioè (X-

2

A/B) =0.--> il massimo di f(x) si ha per x=A-->la moda della normale coincide con A--->

A=Mod(x).

3)

Data la simmetria di f(x), basta analizzare il comportamento di f(x) al crescere di x. Se

^1/2(x-A/B)^2

x-->infinito, e tende a infinito e di conseguenza f(x) tende a 0. --> lim∞f(x)=lim

-∞f(x)=0.

La soluzione dei parametri della retta interpolante a minimi quadrati: ἂ = media

1

2

aritmetica ponderate degli n coefficienti angolari pesati con (x xx̄ ) ἂ =intercetta della

-

i 0

retta con coefficiente angolare ἂ e passante per il punto (xx̄ ;ӯ).

1

Il procedimento indiretto per il calcolo della covarianza nel caso di N valori (xi,

yi), i=1,…,N: è possibile calcolare la codevianza senza l'utilizzo del prodotto degli (xi- x

x̄)*(yi-ӯ) dagli scarti: Cod (X,Y)=Σ(xi- xx̄ )*(yi-ӯ)=Σ(xi*yi-xi*ӯ- xx̄ *yi+ xx̄ *ӯ)= Σxi*yi-ӯ Σxi-

xx̄ Σyi+n xx̄ *ӯ= Σxi*yi-n xx̄ * ӯ, con il procedimento indiretto: COV (X,Y)=1/n

COD(X,Y)=1/nΣxi*yi- xx̄ *ӯ.

Proprietà retta a minimi quadrati:

1)

la somma delle ordinate effettive è uguale alla somma delle ordinate teoriche: Σyi=ŷi,

sapendo che Σyi-ŷi=0 si ottiene: Σ(yi-ŷi)=0-->Σyi-ŷi=0, dalla prima proprietà si capisce

che Mi(Y)-M (Y), cioè la media aritmetica delle ordinate effettive è uguale alla medi

1

aritmetica delle ordinate dell'interpolante.

2)

la retta a minimi quadrati passa per il punto di coordinate (xx̄ ; ӯ), ӯ= ἂ + ἂ * xx̄ . Dalla

1

0

prima proprietà Σyi=ŷi, si deduce che: Σyi=Σ(ἂ + ἂ *xi)-->Σyi=Σn* ἂ + ἂ *Σxi, dividendo

1 1

0 0

per N da entrambe le parti si ottiene: ӯ= ἂ + ἂ * xx̄ .

1

0

3)

La covarianza fra la variabile residua Z e la variabile X è nulla: Cov(Z,X)=1/n

Cod(Z,X)=1/n(Σ(zi-z)*(xi- xx̄ )). Ricordando che ż=0 e che zi=yi-ŷ, si ottiene: Cov (Z,X)=1/n

Σ(yi-ŷi)*(xi- xx̄ )=0, annulla le sommatorie Σ(yi-ŷi)=0 e Σ(yi-ŷi)*(xi- xx̄ )=0.

La scomposizione della devianza totale in devianza spiegata e devianza

residua, nel caso

della retta interpolante a minimi quadrati: si verifica che (yi-ӯ)=(yi-ŷi)+(ŷi-ӯ), il

2 2 2

quadrato dello scarto totale risulta: (yi-ӯ) =(yi-ŷi) +(ŷi-ӯ) +2(yi-ŷi)(ŷi-ӯ), sommando tutti

2 2 2

gli scarti totali al quadrato si ottiene: Σ(yi-ӯ) =Σ(yi-ŷi) +Σ(ŷi-ӯi) +2Σ(yi-ŷi)*(ŷi-ӯi),

sostituendo nell'ultima sommatoria L (xi- xx̄ ) al posto di (ŷi-ӯi) si ha: 2Σ(yi-ŷi)*L (xi- x

1 1

2 2 2

x̄)=2L Σ(yi-ŷi)*(xi- xx̄ ). Otteniamo: Σ(yi-ӯi) =Σ(yi-ŷi) +Σ(ŷi-ӯi) . La devianza spiegata è

1

uguale alla somma del quadrato degli scarti spiegati, la devianza residua è uguale alla

somma del quadrato degli scarti residui-->D =D +D

T R S.

La devianza spiegata in funzione del coefficiente angolare della retta a minimi

quadrati: 2d 2 2 2

I =devianza spiegata/devianza totale=Σ(ŷi-ӯi) /Σ(yi-ӯi) = Σ(ŷi-ӯi) /Σ(ŷi-

2 2

ӯi) +Σ(yi+ŷi) . l'indice assume i valori [0;1]. l'indice assume valore massimo+1 se D =0.

R

2 12

l'indice assume valore min 0 se D =0, devianza spiegata= Σ(ŷi-ӯi) =L Σ(xi- x

S

2 12

x̄) =L *DEV(X).

Relazione fra le frequenze relative marginali e le frequenze relative parziali : L

frequenza relativa marginale fr(bi) è uguale alla media aritmetica ponderata delle

frequenze relative condizionate fr(bi/aj) con pesi pari alla numerosità nj delle distribuzioni

parziali. fr(bi)=ni./N=ni1+...+nij+....+nic/N=[(ni1/n.1)*n.1+...+(nij/n.j)*n.j+...+

(nic/n.c)*n.c]/N. Poiché ni1/n.1=fr(bi/a1) risulta: fr(bi)=[fr(bi/a1)*n.1+...+fr(bi/aj)*n.j+...

+fr(bi/ac)*n.c]/N---> fr(bi)=1/N Σfr(bi/aj)*n.j.

Uguaglianza delle frequenze marginali teoriche nel caso di indipendenza

Dettagli
Publisher
A.A. 2017-2018
5 pagine
SSD Scienze economiche e statistiche SECS-S/01 Statistica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher menguz di informazioni apprese con la frequenza delle lezioni di Statistica I e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Milano - Bicocca o del prof Pollastri Angiola.