Elementi di probabilità e statistica - Appunti

E' l'elaborato, più che appunto, frutto di un semestre di corso a mio parere molto esaustivo e accessibile. Voto conseguito 30 e lode.Argomenti trattati:Introduzione statistica …

Esame Elementi di probabilità e statistica

Facoltà Economia

Dal corso del Prof. Mattioli Elvio

Università Università Politecnica delle Marche - Ancona

Publisher Giuseppe Di palma

A.A. 2013-2014

136 pagine

5 download

Appunto

Vota 4,0 / 5 (2)

Scarica

Estratto del documento

U

∣ ∣

=N

Se un certo supporto fisico , la variabile bivariata (X,Y) si identifica, per quanto riguarda la

successione di dati grezzi

{ }

X , Y u , Y u

( )= ( ) ( )

(X )

i i i=1,… , N

cioè la variabile è rappresentata tramite l’insieme delle modalità i-esime che la variabile (X.Y) assume

quando rilevata sulle i-esime unità. Possiamo anche rappresentarla come segue:

{ }

' ' ' ' ' '

( ) ( ) ( )

X , Y x , y , … , x , y , … , x , y

( )= 1 1 i i N N

Ai fini soprattutto della rappresentazione tabellare e grafica della distribuzione di frequenza, definiamo il

S

Supporto della variabile bivariata , l’immagine di U tramite (X,Y); formalmente si ha:

x , y

{ }

( ) ( ) ( )

S x , y X x Y R : x=X u , y=Y u , per qualche u U

= ∈ ⊆ ∈

x , y

Es.1 per distribuzione di dati grezzi:

Immaginando un collettivo composto da n imprese, siano X e Y rispettivamente:

* X: locazione territoriale;

* Y: settore attività svolta.

Si immagini poi di rilevare:

S NC , S e S Ag ,∈, Se

{ } { }

= =

x y

S x , x e S y , y , y

{ } { }

= =

x 1 2 y 1 2 3

La distribuzione per dati grezzi potrà essere

{ }

X , Y NC , I , NC , A ,… , NC , Se , S , A

( )= ( ) ( ) ( ) ( )

RAPPRESENTAZIONE v.s. BIVARIATE o DOPPIE

La rappresentazione più utile di una distribuzione di frequenza di una variabile bivariata è data dalla tabella

a doppia entrata, dove possiamo riscontrare quanto formalmente detto fino ad ora:

y y y

X/Y … … Totale

1 j m

x N N N 1−¿

… …

1 11 1j 1m N ¿

… … … … … … …

x N N N i−¿

… … ℑ

i i1 ij N ¿

… … … … … … …

x N N N k

… … −¿

k k1 kj km N ¿

N N N

Totale … … N

−1 − −m

DISTRIBUZIONE DI’ FREQUENZA BIVARIATA (X,Y)

La associazione delle coppie ripetute di valori (x,y) contenute nel supporto alla loro frequenza, assoluta o

relativa, determina la Distribuzione delle frequenze c.d. congiunte:

FREQUENZA ASSOLUTA CONGIUNTA e MARGINALE

Per frequenza assoluta congiunta associata alle coppie ripetute di valori (x,y), si intende il numero di unità

N x N y

( ) ( )

della popolazione che presentano simultaneamente/congiuntamente i valori .

x i y j

{ }

X , Y x , y , N , i=1, … , k , j=1, … , m

( )= ( )

i j ij .

che è data da ∣ ∣

{ }

N x , y , y u U : X u , Y u y

( )=x ( )=

( )

=N =N (x )= ∈

ij x, y i j . i j i i

ricordando che vale anche

N =N∗p

ij ij

Data una tabella a doppia entrata, sommando tutte le frequenze congiunte riscontrabili in una riga (o in una

colonna), otteniamo la distribuzione marginale delle frequenza assoluta uni variata, data dall’insieme di

Frequenze marginali che caratterizzano la variabile ad es. X (indica ad es. il numero di individui che hanno

come valore ):

i−¿

x , N

i ¿

,i=1, … , k ,

¿ }

( X≡ ¿

dove

m m

∑ ∑

i−¿= N x , y N

( ) =

x , y i j ij

j j=1

N x

( ) =N

x, y i ¿

Per quanto riguarda l’altra variabile statistica..

{ }

Y ≡ x , N , i=1, … ,k ,

( )

i j

−

dove k

∑

N x , y N

( ) =¿

x , y i j ij

i =1 k

∑

N y

( ) =N = ¿

x , y j j

− i=1

Dalla precedente definizione, posso affermare che la somma di tutte le frequenze marginali è pari a N

(numerosità collettivo)

m k m m k

∑ ∑ ∑ ∑ ∑

N N N N

= = = =N

i−¿ j ij ij

−

j=1 i=1 j j=1 i=1

∑ ¿

i=1

Dove i primi due membri dell’equazione indicano la sommatoria rispettivamente delle frequenze marginali

assoluta della X e della Y, e il terzo e il quarto membro la sommatoria di tutte le frequenze congiunte prima

prendendo in considerazione la variabile X e poi Y.

Il modello di distribuzione di frequenza congiunta, può essere rappresentato come segue:

{ , y i=1, … , k

(x )

X , Y i j

( )= N j=1, … , m

FREQUENZA RELATIVA CONGIUNTA e MARGINALE

Per frequenza relativa congiunta associata alle coppie ripetute di valori (x,y):

{ }

X , Y x , y , p , i=1, … , k , j=1, … , m

( )= ( )

i j ij .

che è data dal rapporto della sommatoria delle frequenze assolute congiunte ed N

∣ ∣

{ }

u : X u x , Y u y

( )= ( )=

∈U N N , y

(x )

i i ij . i j

p p x , y p x , y

( ) ( )

= = = = =

ij x , y i j . i j N N N

o anche

pr X=x ,Y y

¿ ( = )

i i x

quest’ultima indica la proporzione di unità statistiche che manifestano simultaneamente la modalità di X

e di Y.

Analogamente a prima data una tabella a doppia entrata, sommando tutte le frequenze relative congiunte

riscontrabili in una riga (o in una colonna), otteniamo la distribuzione marginale della frequenza assoluta di

una data variabile, ad es. Y, quale insieme di frequenze relative uni variate, che prendono il nome di

Frequenza marginale:

i−¿

x , p

i ¿

,i=1, … , k ,

¿ }

( X≡ ¿

dove

m m

N

∑ ∑

i−¿= p

= ij

N

j j=1

=1 p ¿

e { }

Y ≡ x , p ,i=1,… , k ,

( )

i j

−

dove

k k

N

∑ ∑

p p

= =

j ij

− N

i=1 i=1

Può essere rappresentata

{ y .

Y j

= p j=1, … , m

−

Il modello di distribuzione di frequenza congiunta, può essere rappresentato come segue:

{ , y i=1, … , k

(x )

X , Y i j

( )= p j=1, … , m

Sommando le righe e le colonne delle distribuzioni marginali delle frequenze relative devo ottenere

i−¿=¿ 1

p ¿

∑ ¿

i=1

p =¿1

− m

∑ ¿

j=1

Analogamente, la sommatoria delle frequenze relative congiunte deve essere uguale 1, sempre, come nei casi

sopra indicati, per la condizione di normalizzazione

∑ p 1

=¿

j=1

. k

∑ ∑

p = ¿

, y) S i=1

(x ∈ x , y

Dimostrazione

k m k m

N 1 1

∑ ∑ ∑ ∑

p N

= = = ∗N =1

ij ij

N N N

i=1 j=1 i=1 j=1

Nota bene:

Data una distribuzione bivariata mi posso ricavare quelle marginali, ma non è vero il contrario.

Le frequenze marginali possono essere determinate anche senza ricorrere alle frequenze congiunte

assolute (bastano infatti le frequenze congiunte relative). In simboli

i−¿

P → P

ij ¿

Infatti m

∑

i−¿= p con i=1, … , k

j =1 P ¿

Dimostrazione i−¿

i−¿=P ¿

m m m

N 1 1

∑ ∑ ∑

p N

= = = ∗N ¿

ij ij

N N N

j=1 j=1 j=1

Lo stesso vale per

P → P

ij j

−

Infatti k

∑

P p con j=1, … ,k

j ij

− i=1

Dimostrazione

k k k

N 1 1

∑ ∑ ∑

p N

= = = ∗N =P

ij ij j j

− −

N N N

i=1 i=1 i=1

Es.2: la distribuzione di frequenze congiunte

Immaginando un collettivo composto da n imprese, siano X e Y rispettivamente:

* X: locazione territoriale;

* Y: settore attività svolta. A I Se i−¿

X/Y N ¿

80 360 360 800

NC 20 40 200

S 140

N 100 200 500 1000

−

Con quale frequenza assoluta le imprese del centro nord svolgono attività nel settore primario? 80. Ecc.

DISTRIBUZIONI CONDIZIONATE o SUBORDINATE

Altri tipi di distribuzione, oltre a quelle congiunte e marginali, osservabili da una variabile statistica bivariata

sono le c.d. Distribuzioni Condizionate.

Si definisce distribuzione condizionata la distribuzione di Y (o X) per una fissata modalità di X, con

x S

∈ e si legge Distribuzione condizionata di Y (o X) subordinata a dati valori di X (o più

x x ¿

semplicemente “Y dato X uguale a .

Data una variabile bivariata (X,Y) rappresentata nella forma di distribuzione di frequenza

{ }

, Y ≡ x , y , p ,i=1, … , k e j=1, … , m

( )

(X ) i j ij

Possiamo distinguere due partizioni della popolazione U:

- In termini di righe della tabella (quindi partizione per fissati valori di X):

U=¿i=1 k U

¿ x i

con { }

U u : X u , con i=1, … , k

( )=x

= ∈U

x i

- In termini di righe della tabella (quindi partizione per fissati valori di Y):

U=¿ j=1 mU

¿ y j

con { }

U u :Y u y , con j=1, … , m

( )=

= ∈U

y j

Abbiamo allora due famiglie di distribuzioni condizionate:

∣

Y X ≡ Y U , con i=1, … , k

( )

=x i x

- : indicano come varia la componente Y al variare di X.

È esprimibile come distribuzione di frequenza (assoluta o relativa) uni variata nella forma (nel caso

ad es. di frequenze relative):

p i−¿ p ij

y , p y p x ,

( ) ( )

∨x = =

j j i y i ¿

,i=1, … , k e j=1, … , m

¿ }

( ∣

Y X ≡

( )

=x ¿

Nota bene: come scritto le frequenze relative (o assolute) condizionate si ottengono dividendo le frequenza

congiunta con la frequenza relativa (o assoluta della condizione).

Generalizzando

y j

y x

{

¿ N ij

N∗p p 1 j=1, … , m

¿¿ =

( ) ¿

i −¿

¿ ¿

(Y ∨X =x )=¿

∣

X Y y ≡ Y U , con j=1, … , m

( )

= j y : indicano come varia la componente X al variare di Y.

È esprimibile come distribuzione di frequenza (assoluta o relativa) uni variata nella forma (nel caso

ad es. di frequenze relative):

{ }

( )

∣

X Y y ≡ x , p x y y ,i=1, … , k e j=1, … , m

Anteprima

Vedrai una selezione di 10 pagine su 136