vuoi
o PayPal
tutte le volte che vuoi
I =X /X ,...,I =X /X -->I =I *I *...*I -->X /X =X /X *X /X *...*XJ-1/Xj-2*X /X .
2.1 2 1 j.j-1 j j-1 j.0 1.0 2.1 J.J-1 J 1 2 1 J J-1
0 0
Proprietà delle frequenze relative: 1) fr(aj)=n(aj)/n-->è sempre non negativa n(aj)≥0,n>0. 2)La somma delle
frequenze relative di una distribuzione è uguale a 1: fr +...+fr +...+fr(as)=1,[n +...+n +...+n(as)]/n=1,
(a1) (aj) (a1) (aj)
Σn(aj)/n=1, Σn(aj)=n .
Proprietà della media geometrica relativa ai logaritmi: La media geometrica dei logaritmi di N valori positivi è
1/N
pari al logaritmo della media geometrica degli N valori: log(M (x))=log([x *...*x *...*x ] )=1/N(log x +...+log
1 i N 1
0
xi+...+log x )=1/NΣlog xi-->log(M (x))=M1(log x).
N 0
Media aritmetica
1)Somma degli N scarti (xi-M1)=0--> Σ(Xi-M1)=ΣXi-ΣMi-->ΣX1-N*M1. Dal momento che
M1=1/NΣxi-->Σ(Xi-M1)=ΣXi-ΣXi=0.-->M1 è l'unico valore che annulla la somma degli scarti.
2)Somma del quadrato degli scarti delle xi da un valore A è minima per
2 2 2 2 2 2
A=M1-->Σ(xi-A) =Σ[xi-A-M1+M1] =Σ[(xi-M1)+(M1-A)] =Σ(Xi-M1) +N*(M1-A) +2(M1-A)Σ(xi-M1). Poiché N(A-M1)
2 2
è una quantità non negativa, risulta: Σ(xi-A) ≥Σ(xi-M1) .
3)La media aritmetica totale è uguale alla media aritmetica ponderata delle medie aritmetiche parziali, con pesi
pari alla proprietà dei gruppi (proprietà associativa)-->
1(J) 1(k) 1(j)
M1=(M *N +…+M *N +...+M *N )/(N +...+N +...+N )=1/N ΣM *N
1 1 j k 1 j k j.
4)Se fra i valori Y e quelli di X vi è una relazione lineare del tipo y ,allora fra la media aritmetica di Y e quella
i=a+b*xi
di X vi è la stessa relazione lineare--> M1(Y)=(1/N)Σa+b*xi--> M1(Y)=(1/N)Σa+(1/N)*bΣxi-->
M1(Y)=(1/N)*N*a+b*(1/N)Σxi-->M1(y)=a+b*M1(x).
Procedimento indiretto per il calcolo della devianza o della varianza:
2 2 2 2 2
Dev(X)=Σ(Xi-M1) =Σ(xi +M1 -2M1xi)=Σxi +ΣM1 -2M1Σxi. Poiché Σxi=N*M1, risulta:
2 2 2 2 2 2 2
Dev(X)=Σxi +NM1 -2M1*NM1-->Dev(x)=Σxi -NM1 da cui Var(X)= σ =1/NΣxi -M1 .
Proprietà Varianza 2 2 2 2 2
1) Se Y=a+bx, allora σ (Y)=b *σ (X); se Y=a+bx, allora M1(Y)=a+b*M1(X), per definizione σ (y)=1/NΣ(yi-M1(Y)) ,
2 2 2 2 2
per ipotesi yi=a+bxi e M1(y)=a+b*M1(X)-->[yi-M1(y)] =[a+bxi-a-bM1(X)] =[b(xi-M1(x))] =b *[xi-M1(x)] , -->
*σ
2 2 2 2 2 2 2
σ (Y)=1/NΣb *[xi-M1(X)] =b *1/NΣ[xi-M1(X)] = b (X).
2T 2j 2
2)Scomposizione della varianza totale: σ =1/NΣσ *N +1/NΣ x̄j
- x̄
) *N , la varianza totale si ottiene aggiungendo
j j
alla media ponderata delle varianze parziali la varianza fra le medie parziali. varianza totale=varianza nei gruppi
2T= 2N 2F 2j 2
+ varianza fra i gruppi: σ σ +σ = 1/NΣσ *N +1/NΣ x̄j -x̄
) *N
j j.
Proprietà dell'invarianza alle trasformazioni di scala del coefficiente di variazione: se la variabile non negativa
X è trasformata nella variabile non negativa Y con la trasformazione di scala y=bx (con b>0), allora
CV(y)=CV(x)-->M1(y)=b*M1(x) e σ(y)=b*σ(x)-->CV(y)=σ(y)/M1(y)=b*σ(x)/b*M1(x)=σ(x)/M1(x)=CV(X).
Espressione analitica di R:R è un rapporto fra aree: R= area di concentrazione/area di massima
concentrazione: R=[2/(N-1)]*(ΣPj-Σqj)=[2/(N-1)*[(N-1)/2 -Σqj]=1-[2/(N-1)Σqj].
I requisiti soddisfatti dal rapporto di concentrazione di Gini:
1)2) R=(Area di concentrazione/(Area Max concentrazione)
3)R(Y)=(Σyj*(2j-N-1))/(M1(Y)*N(N-1))=(Σa*xj(2j-N-1))/(aM1(X)*N(N-1))=(a/a)*((Σxj(2j-N-1))/(M1(X)*N(N-1))=R(X
)
4)R(Y)= ((Σh+xj)(2j-N-1))/(M1(h+X)*N(N-1))=(hΣ(2j-N-1)+ Σxj(2j-N-1))/(((h+M1(X))*N(N-1))
5)M1(X)=M1(Y) consegue che R(X) e R(Y) hanno lo stesso denominatore, confrontiamo i numeratori:
Σyi(2i-N-1)- Σxi(2i-N-1)= Σ(yi-xi)(2i-N-1).
Teorema M1=Me in caso di simmetria: se la distribuzione (x ,...x ,...x ) è simmetrica rispetto a M, allora
(1) (j) (N)
M=Me=M1. M=Me-->j=N/2 con N pari, (x -M)+(x -M)=0 da cui x +x =2M da cui
N/2) (N-(N/2)+1) N/2 (n/2)+1)
M=1/2[x +x ]-->M=Me; Con N dispari e j= N+1/2, (x +...x +...x )-N*M+(x +x +...+x )-N*M=0,
(N/2) ((N/2)+1) (1) (2) (N) (N) (jN-1) (1)
NM1+NM1=2NM-->2NM1=2NM-->M=M1-->M=Me=M1.
Proprietà della curva normale
1)la curva normale è simmetrica rispetto a X=A, scegliamo un c>0, dimostriamo che: f(x=A-c)=f(x=A+c), sapendo
^-1/2 (x-A/B)^2
che le ordinate della curva normale sono y=(1/B√2π) * e , sostituisco X=A-c e X=A+c. 1).f(x=A-c)=
^-1/2(A-c-A/B)^2 ^-1/2(c^2/B^2) ^-1/2(A+c-A/B)^2 ^-1/2(c^2/B^2)
(1/B√2π) * e = (1/B√2π) * e . 29. f(x=A+c)=(1/B√2π) * e = (1/B√2π) * e
--> f(x=A-c)=f(x=A+c), per il teorema sulla simmetria A coincide M1 e Me.
^-1/2(X-A/B)^2 1/2(X-A/B)^2
2)la moda della normale coincide con A, y=f(x)=(1/B√2π) * e = (1/B√2π) * (1/e . il massimo di
^1/2(X-A/B)^2 2
f(x) si ha in corrispondenza del minimo di e , cioè (X-A/B) =0.--> il massimo di f(x) si ha per x=A-->la
moda della normale coincide con A---> A=Mod(x). ^1/2(x-A/B)^2
3)Data la simmetria di f(x), basta analizzare il comportamento di f(x) al crescere di x. Se x-->infinito, e
tende a infinito e di conseguenza f(x) tende a 0. --> lim∞f(x)=lim -∞f(x)=0.
La soluzione dei parametri della retta interpolante a minimi quadrati: ἂ = media aritmetica ponderate degli n
1
2
coefficienti angolari pesati con (x x̄
) ἂ =intercetta della retta con coefficiente angolare ἂ e passante per il
-
i 1
0
punto (x̄
; ӯ).
Il procedimento indiretto per il calcolo della covarianza nel caso di N valori (xi, yi), i=1,…,N: è possibile
calcolare la codevianza senza l'utilizzo del prodotto degli (xi- x̄
)*(yi-ӯ) dagli scarti: Cod (X,Y)=Σ(xi-
x̄
)*(yi-ӯ)=Σ(xi*yi-xi*ӯ- x̄
*yi+ x̄
* ӯ)= Σxi*yi-ӯ Σxi- x̄Σyi+n x̄
* ӯ= Σxi*yi-n x̄
* ӯ, con il procedimento indiretto: COV
(X,Y)=1/n COD(X,Y)=1/nΣxi*yi- x̄
* ӯ.
Proprietà retta a minimi quadrati:
1)la somma delle ordinate effettive è uguale alla somma delle ordinate teoriche: Σyi=ŷi, sapendo che Σyi-ŷi=0
si ottiene: Σ(yi-ŷi)=0-->Σyi-ŷi=0, dalla prima proprietà si capisce che Mi(Y)-M (Y), cioè la media aritmetica delle
1
ordinate effettive è uguale alla medi aritmetica delle ordinate dell'interpolante.
2)la retta a minimi quadrati passa per il punto di coordinate (x̄
; ӯ), ӯ= ἂ + ἂ * x̄
. Dalla prima proprietà Σyi=ŷi, si
1
0
deduce che: Σyi=Σ(ἂ + ἂ *xi)-->Σyi=Σn* ἂ + ἂ *Σxi, dividendo per N da entrambe le parti si ottiene: ӯ= ἂ + ἂ * x̄
.
1 1 1
0 0 0
3)La covarianza fra la variabile residua Z e la variabile X è nulla: Cov(Z,X)=1/n Cod(Z,X)=1/n(Σ(zi-z)*(xi- x̄
)).
Ricordando che ż=0 e che zi=yi-ŷ, si ottiene: Cov (Z,X)=1/n Σ(yi-ŷi)*(xi- x̄
)=0, annulla le sommatorie Σ(yi-ŷi)=0 e
Σ(yi-ŷi)*(xi- x̄
)=0.
La scomposizione della devianza totale in devianza spiegata e devianza residua, nel caso
della retta interpolante a minimi quadrati: si verifica che (yi-ӯ)=(yi-ŷi)+(ŷi-ӯ), il quadrato dello scarto totale
2 2 2
risulta: (yi-ӯ) =(yi-ŷi) +(ŷi-ӯ) +2(yi-ŷi)(ŷi-ӯ), sommando tutti gli scarti totali al quadrato si ottiene:
2 2 2
Σ(yi-ӯ) =Σ(yi-ŷi) +Σ(ŷi-ӯi) +2Σ(yi-ŷi)*(ŷi-ӯi), sostituendo nell'ultima sommatoria L (xi- x̄
) al posto di (ŷi-ӯi) si ha:
1
2 2 2
2Σ(yi-ŷi)*L (xi- x̄
)=2L Σ(yi-ŷi)*(xi- x̄
). Otteniamo: Σ(yi-ӯi) =Σ(yi-ŷi) +Σ(ŷi-ӯi) . La devianza spiegata è uguale alla
1 1
somma del quadrato degli scarti spiegati, la devianza residua è uguale alla somma del quadrato degli scarti
residui-->D =D +D
T R S. 2d
La devianza spiegata in funzione del coefficiente angolare della retta a minimi quadrati: I =devianza
2 2 2 2 2
spiegata/devianza totale=Σ(ŷi-ӯi) /Σ(yi-ӯi) = Σ(ŷi-ӯi) /Σ(ŷi-ӯi) +Σ(yi+ŷi) . l'indice assume i valori [0;1]. l'indice
2 12
assume valore massimo+1 se D =0. l'indice assume valore min 0 se D =0, devianza spiegata= Σ(ŷi-ӯi) =L Σ(xi-
R S
2 12
x̄
) =L *DEV(X).
Relazione fra le frequenze relative marginali e le frequenze relative parziali: L frequenza relativa marginale
fr(bi) è uguale alla media aritmetica ponderata delle frequenze relative condizionate fr(bi/aj) con pesi pari alla
numerosità nj delle distribuzioni parziali.
fr(bi)=ni./N=ni1+...+nij+....+nic/N=[(ni1/n.1)*n.1+...+(nij/n.j)*n.j+...+(nic/n.c)*n.c]/N. Poiché ni1/n.1=fr(bi/a1)
risulta: fr(bi)=[fr(bi/a1)*n.1+...+fr(bi/aj)*n.j+...+fr(bi/ac)*n.c]/N---> fr(bi)=1/N Σfr(bi/aj)*n.j.
Uguaglianza delle frequenze marginali teoriche nel caso di indipendenza distributiva con le corrispondenti
frequenze marginali effettive: ň =ni.*n.j/N; ň=Σň --> ň =Σni.*n.j/N=ni./N Σn.j=(ni./N)*N=ni.--> ňi=ni.
ij ij i.
L’indipendenza distributiva implica l’indipendenza in media: se n =(n *n )/N-->allora ӯ =ӯ -->ӯ =(1/n j)Σyi*n ;
ij .j i. j j . ij
per l'ipotesi di indipendenza distributiva, risulta: ӯ (1/n j)Σyi*((n *n )/N)=((n /n )*N)Σyi*ni.=1/N Σyi*ni.=ӯ.
j= . .j i. .j .j
Il calcolo della covarianza in una tabella a doppia entrata attraverso le medie parziali di X o le medie parziali
di Y: Cod(X,Y)=ΣΣ(x x̄
)(y =Σ(x x̄)Σ(y . svolgendolo:
- -ӯ)*n - -ӯ)*n
j i ij j i ij
Σ(y Σy *n =ӯ n -ӯ*n =(ӯ -ӯ)*n.j-->Cod(X,Y)=Σ(xj- x̄
)(ӯ -ӯ)*n e Cov(X,Y)=1/NΣ(xj- x̄
)(ӯ -ӯ)*n
-ӯ)*n -ӯΣn .
i ij= i ij ij j. .j .j j j .j j .j
Proprietà della covarianza:
1)l'indipendenza distributiva implica che Cov(X,Y)=0, per ipotesi c'è indipendenza distributiva, ossia
n =(n *n )/N, Cov(X,Y)=1/NΣΣ(y )*n =1/NΣΣ(y )*(n *n /N)=1/NΣ(x x̄
)*n Σy , per la prima
-ӯ)(x -x̄ -ӯ)(x -x̄ - -ӯ)*n
ij .j i. i j .j i j i. .j j .j i i.
proprietà della media aritmetica le ultime due sommatorie sono uguali a 0-->Cov(X,Y)=0.
2)se uno dei due caratteri Y o X è indipendente in media dall'altro, allora Cov(Y,X)=0, Supponiamo che Y sia
indipendente in media da X: Cov(X,Y)=1/NΣ(x x̄
)(y =1/NΣ(x x̄
)*0*n =0.
- -ӯ)*n -
j j ij j .j
3)Se z =a+bxi e che w =c+dy allora Cov(Z,W)=bdCov(X,Y), è noto che z=