vuoi
o PayPal
tutte le volte che vuoi
M1=(M *N +…+M *N +...+M *N )/(N +...+N +...+N )=1/N ΣM *N
1 1 j k 1 j k j.
4)Se fra i valori Y e quelli di X vi è una relazione lineare del tipo y ,allora fra la media
i=a+b*xi
aritmetica di Y e quella di X vi è la stessa relazione lineare --> M1(Y)=(1/N)Σa+b*xi-->
M1(Y)=(1/N)Σa+(1/N)*bΣxi--> M1(Y)=(1/N)*N*a+b*(1/N)Σxi-->M1(y)=a+b*M1(x).
Procedimento indiretto per il calcolo della devianza o della varianza:
2 2 2 2 2
Dev(X)=Σ(Xi-M1) =Σ(xi +M1 -2M1xi)=Σxi +ΣM1 -2M1Σxi. Poiché Σxi=N*M1, risulta:
2 2 2 2 2 2 2
Dev(X)=Σxi +NM1 -2M1*NM1-->Dev(x)=Σxi -NM1 da cui Var(X)= σ =1/NΣxi -M1 .
Proprietà Varianza
1) 2 2 2
Se Y=a+bx, allora σ (Y)=b *σ (X); se Y=a+bx, allora M1(Y)=a+b*M1(X), per
2 2
definizione σ (y)=1/NΣ(yi-M1(Y)) , per ipotesi yi=a+bxi e M1(y)=a+b*M1(X)-->[yi-
2 2 2 2 2 2 2
M1(y)] =[a+bxi-a-bM1(X)] =[b(xi-M1(x))] =b *[xi-M1(x)] , --> σ (Y)=1/NΣb *[xi-
2 2 2
M1(X)] =b *1/NΣ[xi-M1(X)] 2 2
= b *σ (X).
2) 2T 2j 2
Scomposizione della varianza totale: σ =1/NΣσ *N +1/NΣ xx̄ j- xx̄ ) *N , la varianza totale si
j j
ottiene aggiungendo alla media ponderata delle varianze parziali la varianza fra le medie
2T= 2N 2F
parziali. varianza totale=varianza nei gruppi + varianza fra i gruppi: σ σ +σ =
2j 2
1/NΣσ *N +1/NΣ xx̄ j-xx̄ ) *N
j j.
Proprietà dell'invarianza alle trasformazioni di scala del coefficiente di
variazione : se la variabile non negativa X è trasformata nella variabile non negativa Y
con la trasformazione di scala y=bx (con b>0), allora CV(y)=CV(x)-->M1(y)=b*M1(x) e
σ(y)=b*σ(x)-->CV(y)=σ(y)/M1(y)=b*σ(x)/b*M1(x)=σ(x)/M1(x)=CV(X).
Espressione analitica di R:R è un rapporto fra aree: R= area di
concentrazione/area di massima concentrazione: R=[2/(N-1)]*(ΣPj-Σqj)=[2/(N-
1)*[(N-1)/2 -Σqj]=1-[2/(N-1)Σqj].
I requisiti soddisfatti dal rapporto di concentrazione di Gini:
1)2) R=(Area di concentrazione/(Area Max concentrazione)
3)
R(Y)=(Σyj*(2j-N-1))/(M1(Y)*N(N-1))=(Σa*xj(2j-N-1))/(aM1(X)*N(N-1))=(a/a)*((Σxj(2j-N-
1))/(M1(X)*N(N-1))=R(X)
4)
R(Y)= ((Σh+xj)(2j-N-1))/(M1(h+X)*N(N-1))=(hΣ(2j-N-1)+ Σxj(2j-N-1))/(((h+M1(X))*N(N-
1))
5)
M1(X)=M1(Y) consegue che R(X) e R(Y) hanno lo stesso denominatore, confrontiamo i
numeratori: Σyi(2i-N-1)- Σxi(2i-N-1)= Σ(yi-xi)(2i-N-1).
Teorema M1=Me in caso di simmetria : se la distribuzione (x ,...x ,...x ) è
(1) (j) (N)
simmetrica rispetto a M, allora M=Me=M1. M=Me-->j=N/2 con N pari, (x -M)+(x -
N/2) (N-(N/2)+1)
M)=0 da cui x +x =2M da cui M=1/2[x +x ]-->M=Me; Con N dispari e j=
N/2 (n/2)+1) (N/2) ((N/2)+1)
N+1/2, (x +...x +...x )-N*M+(x +x +...+x )-N*M=0, NM1+NM1=2NM--
(1) (2) (N) (N) (jN-1) (1)
>2NM1=2NM-->M=M1-->M=Me=M1.
Proprietà della curva normale
1)
la curva normale è simmetrica rispetto a X=A, scegliamo un c>0, dimostriamo che: ^-1/2
f(x=A-c)=f(x=A+c), sapendo che le ordinate della curva normale sono y=(1/B√2π) * e
(x-A/B)^2 ^-1/2(A-c-A/B)^2 ^-
, sostituisco X=A-c e X=A+c. 1).f(x=A-c)= (1/B√2π) * e = (1/B√2π) * e
1/2(c^2/B^2) ^-1/2(A+c-A/B)^2 ^-1/2(c^2/B^2)
. 29. f(x=A+c)=(1/B√2π) * e = (1/B√2π) * e --> f(x=A-
c)=f(x=A+c), per il teorema sulla simmetria A coincide M1 e Me.
2) ^-1/2(X-A/B)^2
la moda della normale coincide con A, y=f(x)=(1/B√2π) * e = (1/B√2π) *
1/2(X-A/B)^2 ^1/2(X-A/B)^2
(1/e . il massimo di f(x) si ha in corrispondenza del minimo di e , cioè (X-
2
A/B) =0.--> il massimo di f(x) si ha per x=A-->la moda della normale coincide con A--->
A=Mod(x).
3)
Data la simmetria di f(x), basta analizzare il comportamento di f(x) al crescere di x. Se
^1/2(x-A/B)^2
x-->infinito, e tende a infinito e di conseguenza f(x) tende a 0. --> lim∞f(x)=lim
-∞f(x)=0.
La soluzione dei parametri della retta interpolante a minimi quadrati: ἂ = media
1
2
aritmetica ponderate degli n coefficienti angolari pesati con (x xx̄ ) ἂ =intercetta della
-
i 0
retta con coefficiente angolare ἂ e passante per il punto (xx̄ ;ӯ).
1
Il procedimento indiretto per il calcolo della covarianza nel caso di N valori (xi,
yi), i=1,…,N: è possibile calcolare la codevianza senza l'utilizzo del prodotto degli (xi- x
x̄)*(yi-ӯ) dagli scarti: Cod (X,Y)=Σ(xi- xx̄ )*(yi-ӯ)=Σ(xi*yi-xi*ӯ- xx̄ *yi+ xx̄ *ӯ)= Σxi*yi-ӯ Σxi-
xx̄ Σyi+n xx̄ *ӯ= Σxi*yi-n xx̄ * ӯ, con il procedimento indiretto: COV (X,Y)=1/n
COD(X,Y)=1/nΣxi*yi- xx̄ *ӯ.
Proprietà retta a minimi quadrati:
1)
la somma delle ordinate effettive è uguale alla somma delle ordinate teoriche: Σyi=ŷi,
sapendo che Σyi-ŷi=0 si ottiene: Σ(yi-ŷi)=0-->Σyi-ŷi=0, dalla prima proprietà si capisce
che Mi(Y)-M (Y), cioè la media aritmetica delle ordinate effettive è uguale alla medi
1
aritmetica delle ordinate dell'interpolante.
2)
la retta a minimi quadrati passa per il punto di coordinate (xx̄ ; ӯ), ӯ= ἂ + ἂ * xx̄ . Dalla
1
0
prima proprietà Σyi=ŷi, si deduce che: Σyi=Σ(ἂ + ἂ *xi)-->Σyi=Σn* ἂ + ἂ *Σxi, dividendo
1 1
0 0
per N da entrambe le parti si ottiene: ӯ= ἂ + ἂ * xx̄ .
1
0
3)
La covarianza fra la variabile residua Z e la variabile X è nulla: Cov(Z,X)=1/n
Cod(Z,X)=1/n(Σ(zi-z)*(xi- xx̄ )). Ricordando che ż=0 e che zi=yi-ŷ, si ottiene: Cov (Z,X)=1/n
Σ(yi-ŷi)*(xi- xx̄ )=0, annulla le sommatorie Σ(yi-ŷi)=0 e Σ(yi-ŷi)*(xi- xx̄ )=0.
La scomposizione della devianza totale in devianza spiegata e devianza
residua, nel caso
della retta interpolante a minimi quadrati: si verifica che (yi-ӯ)=(yi-ŷi)+(ŷi-ӯ), il
2 2 2
quadrato dello scarto totale risulta: (yi-ӯ) =(yi-ŷi) +(ŷi-ӯ) +2(yi-ŷi)(ŷi-ӯ), sommando tutti
2 2 2
gli scarti totali al quadrato si ottiene: Σ(yi-ӯ) =Σ(yi-ŷi) +Σ(ŷi-ӯi) +2Σ(yi-ŷi)*(ŷi-ӯi),
sostituendo nell'ultima sommatoria L (xi- xx̄ ) al posto di (ŷi-ӯi) si ha: 2Σ(yi-ŷi)*L (xi- x
1 1
2 2 2
x̄)=2L Σ(yi-ŷi)*(xi- xx̄ ). Otteniamo: Σ(yi-ӯi) =Σ(yi-ŷi) +Σ(ŷi-ӯi) . La devianza spiegata è
1
uguale alla somma del quadrato degli scarti spiegati, la devianza residua è uguale alla
somma del quadrato degli scarti residui-->D =D +D
T R S.
La devianza spiegata in funzione del coefficiente angolare della retta a minimi
quadrati: 2d 2 2 2
I =devianza spiegata/devianza totale=Σ(ŷi-ӯi) /Σ(yi-ӯi) = Σ(ŷi-ӯi) /Σ(ŷi-
2 2
ӯi) +Σ(yi+ŷi) . l'indice assume i valori [0;1]. l'indice assume valore massimo+1 se D =0.
R
2 12
l'indice assume valore min 0 se D =0, devianza spiegata= Σ(ŷi-ӯi) =L Σ(xi- x
S
2 12
x̄) =L *DEV(X).
Relazione fra le frequenze relative marginali e le frequenze relative parziali : L
frequenza relativa marginale fr(bi) è uguale alla media aritmetica ponderata delle
frequenze relative condizionate fr(bi/aj) con pesi pari alla numerosità nj delle distribuzioni
parziali. fr(bi)=ni./N=ni1+...+nij+....+nic/N=[(ni1/n.1)*n.1+...+(nij/n.j)*n.j+...+
(nic/n.c)*n.c]/N. Poiché ni1/n.1=fr(bi/a1) risulta: fr(bi)=[fr(bi/a1)*n.1+...+fr(bi/aj)*n.j+...
+fr(bi/ac)*n.c]/N---> fr(bi)=1/N Σfr(bi/aj)*n.j.
Uguaglianza delle frequenze marginali teoriche nel caso di indipendenza