Media aritmetica
Dati grezzi
Con N ∑ x: x; … ; xi1. Dati grezzi: con 1 Ni=1 μ= N k∑ x ∙ n { }x : x; P, i=1, …, ki i2. Forma di frequenza: con i ii=1 μ= Nk +x x∑ { }¿ ⊢¿ +1i i x : x x; P, i=1, …, k μ= x ∙ P =x3. Per intervalli: con con i i+1 ii i i 2=1i +∞∫ ( ) ∈x: f x x S( )μ= x ∙ f x dx4. Modello teorico continuo: con x xx−∞
Proprietà della media aritmetica
Internalità
La media aritmetica è un valore compreso tra il valore più piccolo del supporto e il valore più grande del supporto.
Dimostrazione
N ∑<x …<¿ xi Ni=1 N ∑<…< ¿ ¿x 2 i=1 I. N ∑<¿ ¿x 1 i=1 N ∑ ¿i=1 N ∑ xNx Nx Nxi II. 1 2 i=1 N< < <…<…<N N N N<x …< μ<…< x III. 1 N =x −μT, i=1, …, N
Del baricentro
Si definisce anzitutto la variabile di scarto. La somma di tutti gli scarti della v.s. X dalla media aritmetica è uguale a zero.
Dimostrazione
N N ∑ ∑ ( )= −μ =0T x I. i ii=1 i=1 N ∑−¿x μ=0i i=1 II. N ∑ ¿i=1 N ∑N x ii=1−¿ =0x i N III. N ∑ ¿i=1 ( )( ) ( )( ) =E=g E T g xT x
Media di una trasformazione di dati
Della linearità
( )=g =aT xa. La media di una costante è pari alla costante stessa allora ( )( ) ( )=E =aE T g x
Dimostrazione
∑ (a ∙ P x) I. ∈Sx x ∑ ( )=a¿ a P x II. ∈Sx xb. La media di una costante che moltiplica una v.s. X è pari alla costante per la media della v.s. X ( )( )( ) =b (X )=g =bx E g x ∙ ET x
Dimostrazione
∑( )( ) ( )=E g x g x ∙ P( x) I. ∈x S x ∑¿ bx ∙ P(x) II. ∈Sx x ∑¿ (x)b x ∙ P(x)=b ∙ E III. ∈Sx x( )=g =a+bxT xc. Dimostrazione: ∑( )( ) ( )=E g x g x ∙ P( x) I. ∈Sx x ∑ ( ) ( )¿ a+bx ∙ P x II. ∈Sx x ∑ ( )( ) ( )¿ +ba ∙ P x ∙ P x III. ∈Sx x ∑ ∑( ) ( )( ) ( )¿ =a ∙ P x b ∙ P x proprietà 4 a+ 4 b IV. ∈S ∈Sx xx x
Dei minimi quadrati
La media aritmetica rende minima la somma degli scarti al quadrato.
Dimostrazione
N N ∑ ∑2 22 2=x−μ ( −a) ( −μ)T x ≥ x=(T x−μ) Anzitutto ii=1 i=1 Dimostrazione: −ax i ¿¿ I. ¿ N ∑ ¿=1i N N ∑ ∑( )2 2¿ −2a +x ∙ x Na II. i ii=1 i=1 N ∑' ''=−2 +2a D x Na=0 =0+2 >D N 0 III. Derivare rispetto ad : e ii=1
Medie potenziate
( )n 1 ∑ is sxs Media di potenze algebriche: si definisce media di potenza di ordine come . i=1=m s N( ) 1k ∑ s s=m x ∙ P Per una distribuzione di frequenza è s i ii=1 1=m−1 k P
Media armonica
Si definisce come la media algebrica di ordine come ∑-1 ixi=1 i √ k ∑ 2=m x ∙ P
Media quadratica
Media di potenza di ordine come 2 2 i ii=1
Media geometrica
∏ P=m =log m x Media geometrica: is→ 0 s 0 ii=1
Proprietà delle medie potenziate
Internalità
Studio comportamento
Dimostrazione
{ }=INFlog m x, …, x I. s→−∞ s 1 N{ }x ,…, x= ¿m 1 Ns II. ¿log s →+∞ m s
Teorema delle medie potenziate
È una funzione monotona non decrescente di se s<t <ms , m s t
Momenti
N ∑ hxh ik x Si definisce momento di ordine della v.s. quantitativa X la media di , ossia: .[ ]h i=1=E x N N ∑ 2xμ Solo il momento primo coincide con la media. Esempio media e momento secondo: mentre( )2 i=1=E x N( )N 1 ∑ 2 2x .i=1=m 2 N
Indici di variabilità
La varianza di una v.s. quantitativa è la media del quadrato dello scarto della variabile dalla sua media (aritmetica). k ∑2 2( )( )==V −μσ x x P Quindi: i ii=1
Formule
M M ∑ ∑2( )−μx x x, x, …, xi i1. Dati grezzi: e con 1 2 Mi=1 i=1( )=V x μ=M Mk k ∑ ∑2( )( ) = −μV x x P μ= x ∙ P2. Distribuzione di frequenza discreta: ei i i i=1i=1
Proprietà
Se la v.s. X è degenere allora e ( ) =0(x) V xV ≥ 01. ( ) ( )2 2 2 2( ) =E −μ =E −E (V x x x x)2. ( )+a =V (x )V x3. Invarianza per traslazione
Scostamento medio
( ) 1k ∑ 1| | s 22 ( )=¿= −θS x P S=Vσ x Di ordine: mentre s μ ss i ii=1 2 =σS Quadratico dalla media aritmetica (deviazione standard o scarto quadratico medio): μ sk ∑ | |−MM S= x P Assoluto dalla mediana: e i e ii=1
Indici di variabilità
Indici che si costituiscono a partire da alcuni valori della distribuzione
S θ s −XR= XRange: max min −QDI=Q Differenza interquartilica: 3 1
Coefficiente di variabilità
σ=CV È pari a: | |μ
Scelta della media
x, …, xμ NChisini: si dice che è la media di osservazioni in un problema in cui interessa una loro funzione1 N( )g x, …, x x, …, x M, se tale funzione assume lo stesso valore quando al posto di si pone quindi: 1 N 1 N( ) ( )=gg x, …, x M, …, M
Indici di posizione
Media Mediana: è il valore intermedio tra gli estremi di una successione finita di valori. È il valore per il quale ( ) =0,5F X Moda: valore del supporto al quale è associata la più grande densità di frequenza relativa o quantità di frequenza relativa.
Differenze medie
{ }−xx S x, …, x i=1, …, N; j=1, …, N Per differenze medie s’intende con ei j x 1 NN N ∑ ∑ ( )−xxi j La differenza media assoluta con ripetizione è: i=1 j=1 ∆ R= 2N( )N N 1 ∑ ∑ s| | s−xx i j La differenza media di ordine con ripetizione è:s s i=1 j=1 ∆ R= 2N
Variabili statistiche bivariate
{ } ( )n x; yU: n, …, n ( ) (n)x u y Data una popolazione e le v.s. e, definiamo la frequenza assolutax, y i j1 Nx=x y= y degli individui che presentano e simultaneamente.i j xy Definiamo la distribuzione statistica doppia o bivariata come l’insieme delle coppie { }( ) ( )( )x, y ≡ x; y; n x; y; i=1, …, r; j=1, …, ci j x, y i j
Proprietà
r c ∑ ∑ ( )=Nn x; y 1. x, y i ji=1 j=12. Distribuzione frequenza assoluta marginale della v.s. X: c ∑ ( ) ( ) ( ) ( )=n +n +…=nn x; y x; y x; y xx, y i j x, y 1 1 x, y 1 2 x ij=1
Distribuzione frequenza assoluta marginale della v.s. X
r ∑ ( ) ( ) ( ) ( )=n +n +…=nn x; y x; y x; y yx, y i j x, y 1 1 x, y 2 1 y ji=1
Calcolo delle frequenze univariate marginali
Della X: . x, y i j x ij=1 c ∑ ( ) ( )=PPi P x; y x; i=1, …, r
Della Y: . x, y i j y j=1 r ∑ ( ) ( )=PP j= P x; y y; j=1, …, c
Mentre le frequenza relativa congiunta: con x, y i j N
Relazione o connessione tra X e Y
Quando non c’è connessione tra le due variabili, queste si dicono indipendenti, se per ciascuna coppia di valori la frequenza relativa congiunta è pari al prodotto delle marginali { }( )( ) =Pix, y: x; y; Ṕ ∙ P j; i=1, …, r; j=1, …, ci j ij . .
Modello osservato:
| x\y | 2 | 5 | P.j |
|---|---|---|---|
| Pi.1 | 0,2 | 0,1 | 0,33 |
| 3 | 0,4 | 0,3 | 0,7 |
| P.j | 0,6 | 0,4 | 1 |
Modello teorico:
| x\y | 2 | 5 | P.j |
|---|---|---|---|
| Pi.1 | 0,18 | 0,12 | 0,33 |
| 3 | 0,42 | 0,28 | 0,7 |
| P.j | 0,6 | 0,4 | 1 |
Per costruire il modello teorico, si moltiplicano i risultati e si divide per il totale: Nx ⫫ y M . O .≠ M . T . x y allora (indipendenti); se allora e non indipendenti. x ⫫ y Se, vi sono 3 condizioni: ( ) ( ) ( )=PP x; y x ∙ P . y x, y i j x . i y j
( ) ( )=PP y . y la x non condiziona la y y j y jx ( ) ( )=PP x x la y non condizionala x x i x . iy ¿ ∙ n .. j−n La contingenza è pari al valore osservato meno quello teorico: ij N
Frequenza congiunta teorica
r c ∑ ∑ 2´( )− =0n n Condizione di normalizzazione: ij iji=1 j=12( )−r c n ń∑ ∑ ij ij2 x⫫ y=χ2 Chi: se ńi=1 j=1 ij
Dipendenza perfetta
Y da X: la variabile Y dipende perfettamente da X se ad ogni modalità della X è associata una sola i jdella Y y x X da Y: la variabile X dipende perfettamente da Y se ad ogni modalità della Y è associata una sola j i della X x Bilaterale: X e Y sono perfettamente dipendenti se ad ogni valore della X corrisponde un solo valore iy della Y j
In quest’ultimo caso si parla di funzione invertibile, con come misura della dipendenza bilaterale.
χ2 In quest’ultimo caso si parla di funzione invertibile, con come misura della dipendenza bilaterale. χ2 ( )−n nij ij ¿ń ∙ n .NN ∑ ∑ ij . j2 = =Pi ∙ P j= Ṕ=χ Per cui: con per cui. . j´n N NNi j ijNN2 ( ) ( )´ 2 2( )−n n − ´n n n ńij ij ij ij ij ij− 2( )−P Ṕ2 N N NN ∑ ∑ ∑ ∑ ∑ ∑ ij ij2 = = =N =Nχ ∙ ∙PṔ Ṕ Ṕi j i j j i jj j jN N
√2 2χ χ2 2=ψ =Psi Indice di contingenza media quadratica: , per cui Psi=ψ=N N { }{ } 2 ( ) ( )( ) ( )−12 2N r; c−1 <0< χ N r−1; c−1χ χMax. di: per cui. Dividendo per max.: minmin { }( ) ( )N r−1; c−120 χ min< <2 2 2max . χ max . χ max .
Indice di Cramer
Indice normalizzato che varia tra 0 e 1 o Indice di Cramer: . Con tale indice posso { }( ) ( )N r−1; c−1minr c confrontare e differenti.
Variabili quantitative
Con X e Y quantitative: . La media condizionata di Y è: { } ∑y ; P ; j=1, …, c ( )=E Y y ∙ P j jx=x y j ji i j=1x= x ii
Funzione di regressione
( )φ x(x ), y1. Sia la v.s. doppia quantitativa discreta, e si consideri la media condizionata di Y indicata con i { }( )φ x S x, …, x. La definita sul supporto è detta funzione di regressione della Y sulla X ed è descritta i x 1 r { }( )( )x ; φ x ; i=1, …, r dai valori: . È un modo di descrivere la Y tramite la X. i i ( )Ψ y2. Si definisce funzione di regressione della X sulla Y, indicata con , la media condizionata della X alla Y. È j { }( )( )y ; Ψ y ; j=1, …, c descritta dalle coppie di valori. j j
Errore quadratico medio
( )2[ ](x)E y−g g(x) Con tale criterio è possibile descrivere la funzione di regressione: è minimo quando a) φ(x sostituiamo, secondo il criterio dell’errore quadratico medio.
Dimostrazione
( )( ) 2[ ]2[ ] ( ) ( )( ) ( )−g ( )( =E +E y−g x) y−φ x φ x x I. ( )[ ]2 2( ) ( ) ( )( )( ) ( )−g ( ) ( ) ( ) ( )¿ + + −φ −gE y−φ x φ x x 2 y x φ x x II. [ ] [ ] [ ][ ]2 2( ) ( )( ) ( )−g ( )( ) =02 E y−φ x φ x x ( ) ( )−g ( ) ( ) ( )−g ( )¿ + + −φ E y−φ x E φ x x 2 E y x φ x x III. con Dimostrazione che il doppio prodotto è pari a zero con il metodo delle sommatorie: r c [ ]∑ ∑ ( )( )( ) ( ) ( )−φ −g(x) 2 y x φ x x ∙ P, y I. 2 variabili j i i i iji=1 j=1 [ ]r c =PP ∙ Pi ∑ ∑( ) ( )( ) ( ) ( )¿ −g −φ2 φ x x y x ∙ P II. con ij j .i i j i ij i=1i j=1 [ ]r c ∑ ∑( ) ( )( ) ( ) ( )¿ −g −φ =02 φ x x y x ∙ P ∙ Pi III. i i j i j. =1i j=1 i( )y yφ=EAll’interno delle quadre calcoliamo la media della variabile dalla sua media, perché. La x x media degli scarti dalla media è zero. [ ] [ ]( )2 2 22( ) [ ] ( ) ( ) ( ) ( )=φg x x( ) ( ) ( )−g ( )y−g x (=E + =0E y−g x) y−φ x E φ x x La media di è: se. ≥ 0 ≥ 0
Indipendenza regressiva
( ) ( )φ x Ψ y(x ), ySia una variabile bidimensionale quantitativa discreta con funzioni di regressione e, si i j ( )=μφ x dice che Y è regressivamente indipendente dalla X quando, e che X è regressivamente indipendente y( )=μΨ y dalla Y quando. x
Teorema
yy x Dimostrazione: ∑( ) ( )( ) =E φ x φ x ∙ Pi I. i .i r c c =PP ∙ Pi ∑ ∑ ∑¿ =φ(x)y ∙ P ∙ Pi y ∙ P II. con e j. ij j. j j ii=1 j=1 j=1i i ∑ ∑¿ y ∙ P III. j iji j ∑ ∑ ∑¿ =Py P P .IV. con j ij ij j j i i =i?y ∙ P . μj j y ∑ V. ¿ ¿ j( )( ) =μE Ψ y Procedimento analogo per con le opportune modifiche. x
Regole generali
y { }y ; P ; j=1, …, c 1. j j x=x i i c( )yx ∑=E y ∙ P 2. j jj=1 i c( )y ∑ ( )( )= −φV y x ∙ P 3. j i j x j=1 i
Funzione di regressione
{ }( )( ) ( )φ x: x; φ x; Pi; i=1, …, r 1. i i i. ∑( ) ( )( ) = =μE φ x φ x ∙ Pi 2. i. yi ( )( )y ∑ 2( )( ) ( )( ) = −μ =VV φ x φ x ∙ Pi E 3. i y. xi
Scomposizione della varianza dalla Y
[ ]2( )( )=E −μV y y I. y [ ]2( )( )( )( ) ( )−μ
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.