Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
U
∣ ∣
=N
Se un certo supporto fisico , la variabile bivariata (X,Y) si identifica, per quanto riguarda la
successione di dati grezzi
{ }
X , Y u , Y u
( )= ( ) ( )
(X )
i i i=1,… , N
cioè la variabile è rappresentata tramite l’insieme delle modalità i-esime che la variabile (X.Y) assume
quando rilevata sulle i-esime unità. Possiamo anche rappresentarla come segue:
{ }
' ' ' ' ' '
( ) ( ) ( )
X , Y x , y , … , x , y , … , x , y
( )= 1 1 i i N N
Ai fini soprattutto della rappresentazione tabellare e grafica della distribuzione di frequenza, definiamo il
S
Supporto della variabile bivariata , l’immagine di U tramite (X,Y); formalmente si ha:
x , y
{ }
2
( ) ( ) ( )
S x , y X x Y R : x=X u , y=Y u , per qualche u U
= ∈ ⊆ ∈
x , y
Es.1 per distribuzione di dati grezzi:
Immaginando un collettivo composto da n imprese, siano X e Y rispettivamente:
* X: locazione territoriale;
* Y: settore attività svolta.
Si immagini poi di rilevare:
S NC , S e S Ag ,∈, Se
{ } { }
= =
x y
S x , x e S y , y , y
{ } { }
= =
x 1 2 y 1 2 3
La distribuzione per dati grezzi potrà essere
{ }
X , Y NC , I , NC , A ,… , NC , Se , S , A
( )= ( ) ( ) ( ) ( )
RAPPRESENTAZIONE v.s. BIVARIATE o DOPPIE
La rappresentazione più utile di una distribuzione di frequenza di una variabile bivariata è data dalla tabella
a doppia entrata, dove possiamo riscontrare quanto formalmente detto fino ad ora:
y y y
X/Y … … Totale
1 j m
x N N N 1−¿
… …
1 11 1j 1m N ¿
… … … … … … …
x N N N i−¿
… … ℑ
i i1 ij N ¿
… … … … … … …
x N N N k
… … −¿
k k1 kj km N ¿
N N N
Totale … … N
j
−1 − −m
DISTRIBUZIONE DI’ FREQUENZA BIVARIATA (X,Y)
La associazione delle coppie ripetute di valori (x,y) contenute nel supporto alla loro frequenza, assoluta o
relativa, determina la Distribuzione delle frequenze c.d. congiunte:
FREQUENZA ASSOLUTA CONGIUNTA e MARGINALE
Per frequenza assoluta congiunta associata alle coppie ripetute di valori (x,y), si intende il numero di unità
N x N y
( ) ( )
e
della popolazione che presentano simultaneamente/congiuntamente i valori .
x i y j
{ }
X , Y x , y , N , i=1, … , k , j=1, … , m
( )= ( )
i j ij .
che è data da ∣ ∣
{ }
N x , y , y u U : X u , Y u y
( )=x ( )=
( )
=N =N (x )= ∈
ij x, y i j . i j i i
ricordando che vale anche
N =N∗p
ij ij
Data una tabella a doppia entrata, sommando tutte le frequenze congiunte riscontrabili in una riga (o in una
colonna), otteniamo la distribuzione marginale delle frequenza assoluta uni variata, data dall’insieme di
Frequenze marginali che caratterizzano la variabile ad es. X (indica ad es. il numero di individui che hanno
x
come valore ):
i
i−¿
x , N
i ¿
,i=1, … , k ,
¿ }
( X≡ ¿
dove
m m
∑ ∑
i−¿= N x , y N
( ) =
x , y i j ij
j j=1
=1
N x
( ) =N
x, y i ¿
Per quanto riguarda l’altra variabile statistica..
{ }
Y ≡ x , N , i=1, … ,k ,
( )
i j
−
dove k
∑
N x , y N
( ) =¿
x , y i j ij
i =1 k
∑
N y
( ) =N = ¿
x , y j j
− i=1
Dalla precedente definizione, posso affermare che la somma di tutte le frequenze marginali è pari a N
(numerosità collettivo)
m k m m k
∑ ∑ ∑ ∑ ∑
N N N N
= = = =N
i−¿ j ij ij
−
j=1 i=1 j j=1 i=1
=1
k
∑ ¿
i=1
Dove i primi due membri dell’equazione indicano la sommatoria rispettivamente delle frequenze marginali
assoluta della X e della Y, e il terzo e il quarto membro la sommatoria di tutte le frequenze congiunte prima
prendendo in considerazione la variabile X e poi Y.
Il modello di distribuzione di frequenza congiunta, può essere rappresentato come segue:
{ , y i=1, … , k
(x )
X , Y i j
( )= N j=1, … , m
ij
FREQUENZA RELATIVA CONGIUNTA e MARGINALE
Per frequenza relativa congiunta associata alle coppie ripetute di valori (x,y):
{ }
X , Y x , y , p , i=1, … , k , j=1, … , m
( )= ( )
i j ij .
che è data dal rapporto della sommatoria delle frequenze assolute congiunte ed N
∣ ∣
{ }
u : X u x , Y u y
( )= ( )=
∈U N N , y
(x )
i i ij . i j
p p x , y p x , y
( ) ( )
= = = = =
ij x , y i j . i j N N N
o anche
pr X=x ,Y y
¿ ( = )
i i x
quest’ultima indica la proporzione di unità statistiche che manifestano simultaneamente la modalità di X
i
y
e di Y.
j
Analogamente a prima data una tabella a doppia entrata, sommando tutte le frequenze relative congiunte
riscontrabili in una riga (o in una colonna), otteniamo la distribuzione marginale della frequenza assoluta di
una data variabile, ad es. Y, quale insieme di frequenze relative uni variate, che prendono il nome di
Frequenza marginale:
i−¿
x , p
i ¿
,i=1, … , k ,
¿ }
( X≡ ¿
dove
m m
N
∑ ∑
ij
i−¿= p
= ij
N
j j=1
=1 p ¿
e { }
Y ≡ x , p ,i=1,… , k ,
( )
i j
−
dove
k k
N
∑ ∑
ij
p p
= =
j ij
− N
i=1 i=1
Può essere rappresentata
{ y .
Y j
= p j=1, … , m
j
−
Il modello di distribuzione di frequenza congiunta, può essere rappresentato come segue:
{ , y i=1, … , k
(x )
X , Y i j
( )= p j=1, … , m
ij
Sommando le righe e le colonne delle distribuzioni marginali delle frequenze relative devo ottenere
i−¿=¿ 1
p ¿
k
∑ ¿
i=1
e
p =¿1
j
− m
∑ ¿
j=1
Analogamente, la sommatoria delle frequenze relative congiunte deve essere uguale 1, sempre, come nei casi
sopra indicati, per la condizione di normalizzazione
m
∑ p 1
=¿
ij
j=1
. k
∑ ∑
p = ¿
ij
, y) S i=1
(x ∈ x , y
Dimostrazione
k m k m
N 1 1
∑ ∑ ∑ ∑
ij
p N
= = = ∗N =1
ij ij
N N N
i=1 j=1 i=1 j=1
Nota bene:
Data una distribuzione bivariata mi posso ricavare quelle marginali, ma non è vero il contrario.
Le frequenze marginali possono essere determinate anche senza ricorrere alle frequenze congiunte
assolute (bastano infatti le frequenze congiunte relative). In simboli
i−¿
P → P
ij ¿
Infatti m
∑
i−¿= p con i=1, … , k
ij
j =1 P ¿
Dimostrazione i−¿
i−¿=P ¿
m m m
N 1 1
∑ ∑ ∑
ij
p N
= = = ∗N ¿
ij ij
N N N
j=1 j=1 j=1
Lo stesso vale per
P → P
ij j
−
Infatti k
∑
P p con j=1, … ,k
=
j ij
− i=1
Dimostrazione
k k k
N 1 1
∑ ∑ ∑
ij
p N
= = = ∗N =P
ij ij j j
− −
N N N
i=1 i=1 i=1
Es.2: la distribuzione di frequenze congiunte
Immaginando un collettivo composto da n imprese, siano X e Y rispettivamente:
* X: locazione territoriale;
* Y: settore attività svolta. A I Se i−¿
X/Y N ¿
80 360 360 800
NC 20 40 200
S 140
N 100 200 500 1000
j
−
Con quale frequenza assoluta le imprese del centro nord svolgono attività nel settore primario? 80. Ecc.
DISTRIBUZIONI CONDIZIONATE o SUBORDINATE
Altri tipi di distribuzione, oltre a quelle congiunte e marginali, osservabili da una variabile statistica bivariata
sono le c.d. Distribuzioni Condizionate.
Si definisce distribuzione condizionata la distribuzione di Y (o X) per una fissata modalità di X, con
x S
∈ e si legge Distribuzione condizionata di Y (o X) subordinata a dati valori di X (o più
x x ¿
semplicemente “Y dato X uguale a .
i
Data una variabile bivariata (X,Y) rappresentata nella forma di distribuzione di frequenza
{ }
, Y ≡ x , y , p ,i=1, … , k e j=1, … , m
( )
(X ) i j ij
Possiamo distinguere due partizioni della popolazione U:
- In termini di righe della tabella (quindi partizione per fissati valori di X):
U=¿i=1 k U
¿ x i
con { }
U u : X u , con i=1, … , k
( )=x
= ∈U
x i
i
- In termini di righe della tabella (quindi partizione per fissati valori di Y):
U=¿ j=1 mU
¿ y j
con { }
U u :Y u y , con j=1, … , m
( )=
= ∈U
y j
j
Abbiamo allora due famiglie di distribuzioni condizionate:
∣
∣
Y X ≡ Y U , con i=1, … , k
( )
( )
=x i x
- : indicano come varia la componente Y al variare di X.
i
È esprimibile come distribuzione di frequenza (assoluta o relativa) uni variata nella forma (nel caso
ad es. di frequenze relative):
p i−¿ p ij
y , p y p x ,
( ) ( )
∨x = =
j j i y i ¿
,i=1, … , k e j=1, … , m
¿ }
( ∣
Y X ≡
( )
=x ¿
i
Nota bene: come scritto le frequenze relative (o assolute) condizionate si ottengono dividendo le frequenza
congiunta con la frequenza relativa (o assoluta della condizione).
Generalizzando
y j
.
y x
{
j
¿ N ij
N∗p p 1 j=1, … , m
¿¿ =
( ) ¿
i −¿
¿ ¿
(Y ∨X =x )=¿
i
∣
∣
X Y y ≡ Y U , con j=1, … , m
( )
( )
= j y : indicano come varia la componente X al variare di Y.
j
È esprimibile come distribuzione di frequenza (assoluta o relativa) uni variata nella forma (nel caso
ad es. di frequenze relative):
{ }
p
( )
ij
∣
X Y y ≡ x , p x y y ,i=1, … , k e j=1, … , m