Che materia stai cercando?

Anteprima

ESTRATTO DOCUMENTO

tali costanti sono viste come oggetto dell’inferenza dal campione alla popolazione sono definite

parametri.

In altri termini il principale obiettivo di un’indagine campionaria è quello di raccogliere dati che

consentiranno di generalizzare all'intera popolazione i risultati ottenuti dal campione. Questo

processo di generalizzazione è detto «inferenza». studio del

campione

campionamento

popolazione campione

inferenza

2. Popolazione e campione

Nella fase in cui si definiscono gli obiettivi della ricerca (astrazione) viene anche definita la

popolazione oggetto di studio o popolazione obiettivo. Definire la popolazione obiettivo significa

individuare con esattezza la natura dei suoi elementi componenti, cioè delle unità oggetto di studio,

e la sua estensione spaziale e temporale.

La popolazione è l'insieme di tutte le unità statistiche, o elementi, di interesse. Si parla di

popolazione finita quando le unità statistiche sono in numero finito e sono etichettabili. In seguito

si farà riferimento esclusivamente a popolazioni di dimensione finita ed si indicherà con N il

numero complessivo di unità componenti la popolazione.

Un campione è un sottoinsieme delle unità della popolazione, che la rappresenti con riferimento al

problema oggetto di studio. La dimensione del campione, e quindi il numero complessivo di unità

componenti il campione, si indicherà con n≤N.

Definita la popolazione obiettivo, è necessario verificare la disponibilità di una base di

campionamento che le corrisponda perfettamente. Le unità della base di campionamento sono

dette unità di campionamento (UC). 3

PDF created with pdfFactory trial version www.pdffactory.com

Occorre, quindi, disporre di una lista completa delle unità della popolazione. La lista (archivio) è

l’insieme ordinato di etichette delle unità della popolazione, registrate su un supporto che ne

consenta la consultazione. La lista include informazioni ausiliarie (indirizzo) utilizzate dal metodo

di campionamento e di stima. Una lista ottimale deve avere le seguenti proprietà:

§ copertura: tutti gli elementi della popolazione (UP) devono essere rappresentati nella lista;

§ non devono essere presenti duplicazioni;

§ non devono essere presenti elementi estranei.

Purtroppo sono frequenti i casi in cui non esiste perfetta coincidenza tra popolazione di selezione,

contenuta nella base di campionamento, e popolazione obiettivo. Infatti, soprattutto in campo

sociale ed economico, gran parte delle liste disponibili presentano difetti tra i quali il più grave è

quello dell’incompletezza.

Oltre alle popolazioni obiettivo e di selezione, è necessario parlare anche di popolazione di

indagine. Selezionato il campione, accadrà normalmente di non poterne osservare tutte le unità per

impossibilità di contattarle o per un loro rifiuto di partecipazione all'indagine. Il fenomeno della

mancata osservazione di un'unità che fa parte della popolazione di selezione prende il nome di

mancata risposta totale. In presenza di questo fenomeno il campione fornisce evidenze soltanto

sull'insieme di coloro che sarebbe stato possibile osservare se l'indagine fosse stata completa.

Questo insieme costituisce la popolazione di indagine.

Quindi:

§ la popolazione obiettivo, cui è direttamente interessato chi svolge l'indagine, differisce da

quella di selezione a causa dell'incompletezza della lista;

§ la popolazione di selezione differisce a sua volta da quella di indagine a causa della non

risposta. 4

PDF created with pdfFactory trial version www.pdffactory.com

La popolazione di selezione (UC) sarà costituita da N unità. Ad ogni unità viene associata

un’etichetta identificativa U . La variabile oggetto di indagine sarà indicata con Y e il valore,

i

incognito, della stessa su ogni unità di campionamento sarà denotata con Y

i.

Unità U U … U … U

1 2 i N

(etichette)

Valori di Y Y Y … Y … Y

1 2 i N

(incogniti)

N: numerosità della popolazione Y: carattere di interesse

U : etichetta dell’unità di campionamento i- Y : valore incognito della variabile di interesse

i i

esima sull’unità di campionamento U

i

3. Campionamento probabilistico e non probabilistico

Vi sono numerosi metodi per selezionare un campione e diverse possibilità di classificarli. Una

distinzione di importanza fondamentale è quella tra campioni probabilistici e non probabilistici.

Si parla di campionamento probabilistico quando le unità sono selezionate con meccanismo

casuale e hanno tutte una probabilità nota e non nulla di essere selezionate. In particolare devono

ricorrere le seguenti condizioni:

(a) è possibile definire l'insieme C dei campioni distinti che possono essere estratti dalla

popolazione;

(b) a ciascuno dei campioni c è possibile associare una probabilità di selezione p(c);

(c) tutte le unità della popolazione hanno una probabilità non nulla di essere estratte;

(d) esiste un meccanismo di selezione casuale che garantisce la selezione di ciascun

campione secondo la probabilità teorica.

Tutti i campioni probabilistici vengono formati ricorrendo ad un meccanismo di selezione

casualizzata o casuale. Tale meccanismo, che è sintetizzabile in un insieme di regole e/o algoritmi,

viene denominato schema di campionamento.

Nell’ambito del campionamento probabilistico si considereranno le seguenti tecniche: casuale

semplice; sistematico; stratificato; a grappoli; a stadi. 5

PDF created with pdfFactory trial version www.pdffactory.com

Si parla di campionamento non probabilistico quando non ricorrono le condizioni viste per quello

probabilistico. Tale tipo di campionamento:

§ rappresenta la modalità prevalente nelle ricerche di mercato, nelle cd. Internet surveys e nei

sondaggi di opinione, per i quali la tempestività è la dimensione più ricercata;

§ non consente inferenze sulle proprietà statistiche dei metodi di stima utilizzati;

§ il rischio di distorcere la rappresentatività della popolazione è elevato (bias);

§ non richiede la lista.

Di seguito si descrivono brevemente le forme più comuni di campione non probabilistico che

possono essere raggruppate in due categorie: campioni ragionati e campioni fortuiti o a caso.

Campioni a scelta ragionata: sono formati senza alcun ricorso a meccanismi di casualizzazione.

La scelta delle unità da includere nel campione è affidata al ricercatore (o al rilevatore) ed è

operata il più delle volte con obiettivi di rappresentatività di certi aspetti strutturali della

popolazione.

In tale ambito rientrano i campioni per quote, formati previa classificazione delle unità

della popolazione in gruppi. Il rilevatore deve selezionare unità appartenenti a ciascun

gruppo fino al raggiungimento di prestabilite quote, cioè dimensioni, in modo da riprodurre

nel campione (relativamente ai gruppi formati) la struttura della popolazione.

Un altro tipo diffuso di campione ragionato è quello formato da unità tipo, unità cioè che a

giudizio di un esperto, cui è demandata la loro selezione, possiedono caratteristiche ritenute

più frequenti nella popolazione.

Molto simile al campione di unità tipo è quello formato da aree barometro, circoscrizioni

territoriali nelle quali si riscontrano comportamenti analoghi a quelli medi dell'intera

popolazione.

Campioni selezionati fortuitamente o a caso. il termine a caso non deve essere confuso con

casualmente; questi campioni infatti non sono formati né con l'ausilio di tecniche di tipo

casuale, né seguendo procedimenti che implicano la preferenza da parte del rilevatore per

certe unità anziché per altre. Appartengono a questa categoria i campioni formati da:

— volontari (i pazienti di un centro medico, i rispondenti ad un questionario inserito in

un giornale, ecc.);

— unità che transitano da passaggi obbligati come frontiere, ingressi di edifici, le casse

di un supermercato, ecc.;

— le parti più accessibili di popolazioni generalmente formate da oggetti. 6

PDF created with pdfFactory trial version www.pdffactory.com

4. Campionamento probabilistico: strategia di campionamento e

disegno di campionamento

La selezione del campione e la stima dei parametri della popolazione rappresentano senz'altro i due

momenti di maggiore interesse teorico dell'indagine campionaria.

Le fasi relative alla selezione del campione e alla stima dei parametri della popolazione

costituiscono, in un’accezione ampia, la cosiddetta strategia di campionamento che comprende le

operazioni relative a:

§ l'identificazione delle unità campionarie;

§ l'individuazione di aggregati di unità per una eventuale selezione a più stadi e

l'identificazione di elementi per la costruzione di strati e per la classificazione al loro interno

delle unità;

§ la scelta della metodologia per l'estrazione delle unità e per la stima dei parametri di

interesse.

Con il termine piano o disegno di campionamento si intende la distribuzione di probabilità p(c)

associata ai possibili campioni che sono selezionabili, sulla base di un prestabilito schema di

campionamento, da una data popolazione. Quindi nel disegno di campionamento si devono

precisare i seguenti elementi:

• schema di campionamento e tecnica di estrazione;

• universo dei campioni: insieme dei campioni di numerosità n che possono essere estratti

dalla popolazione di numerosità N secondo lo schema prefissato; il numero dei campioni

ottenibili C è noto come cardinalità dell’universo dei campioni;

N,n

• probabilità di selezione di ciascuno dei campioni p(c) : probabilità che il campione c

sia estratto;

• π ∈c)

probabilità di inclusione del primo ordine =P(U : probabilità che il campione

i i

estratto contenga l’unità U ; o anche probabilità che l’unità U sia contenuta nel

i i

campione estratto;

• π ∈c]

probabilità di inclusione del secondo ordine =P[(U ,U ) : probabilità che il

ij i j

campione estratto contenga le unità U e U ; o anche probabilità che le unità U e U siano

i j i j

contenute nel campione estratto. 7

PDF created with pdfFactory trial version www.pdffactory.com

5. La stima delle caratteristiche della popolazione

La stima è il procedimento statistico mediante il quale un valore ricavato come funzione delle

osservazioni campionarie viene assunto a rappresentare il valore incognito di un parametro di

interesse nella popolazione.

Il parametro oggetto dell’indagine è una funzione delle modalità osservabili sull’insieme delle unità

( )

θ = K K

della popolazione F Y , , Y , , Y .

1 i N

I parametri di maggiore interesse sono:

N

=

§ il totale T Y

i

=

i 1

N

∑ Y

i

= =

§ i 1

la media Y N

Nel caso di variabili quantitative tali parametri rappresentano l’ammontare totale del carattere nel

collettivo e l’ammontare medio. Nel caso di variabili qualitative i parametri rappresentano

rispettivamente la frequenza assoluta e la frequenza relativa, come si chiarirà di seguito.

Volendo effettuare un’indagine di tipo campionario, ai fini della stima di parametri è necessario

definire la strategia di campionamento e, quindi, costruire un disegno di campionamento e scegliere

il relativo stimatore.

Nel campionamento dalle N unità della popolazione di selezione si devono estrarre n unità

campionarie u . A partire dai valori del carattere Y osservati sulle unità campionate y si procede

(i) (i)

alla stima dei parametri della popolazione.

Campione

Unità campionarie u u … u … u

(1) (2) (j) (n)

(etichette)

Valori di Y y y … y … y

(1) (2) (j) (n)

(rilevati)

n: numerosità della popolazione y : valore della variabile di interesse rilevato sull’unità

(i)

u : etichetta dell’unità estratta all’i-esima estrazione campionata u

(i) (i)

Per effettuare la stima si utilizzano delle funzioni delle osservazioni campionarie o stimatori ed in

genere gli stimatori dei parametri considerati sono delle funzioni lineari, o in altri termini i valori

stimati si ottengono come combinazione lineare delle osservazioni campionarie. Si supponga di

voler stimare il totale di un carattere Y in una popolazione di N unità, uno stimatore di tipo lineare

8

PDF created with pdfFactory trial version www.pdffactory.com

=

ˆ

avrà la seguente espressione: T y w . Dallo stimatore del totale è possibile ricavare lo

( ) ( )

i i

i c ˆ

T T 1 ∑

ˆ

= = = .

stimatore della media della popolazione in quanto Y da cui y w

Y ( ) ( )

i i

N N

N ∈

i c

Uno stimatore lineare molto utilizzato nel caso di campionamento senza ripetizione è lo stimatore di

Horvitz-Thompson (HT) in cui i pesi w sono dati dall’inverso della probabilità di inclusione del

(i)

y

∑ ( )

=

ˆ i

primo ordine T . La formulazione dello stimatore si modifica in relazione al piano di

π

HT ( )

i c i

campionamento in quanto varia l’espressione della probabilità di inclusione.

Lo stimatore HT è corretto nel senso che il suo valore atteso nell’universo dei campioni è uguale al

parametro. Nonostante la correttezza, la maggior parte, se non la totalità, delle stime campionarie

differirà in più o in meno dal parametro della popolazione. In altre parole le stime campionarie

avranno una variabilità più o meno elevata intorno al valore centrale rappresentato, come si è detto,

dal parametro della popolazione. E' intuitivo che se questa variabilità è elevata è del pari elevata la

probabilità che la stima di un campione casuale risulti anche molto diversa dal parametro della

popolazione. Al contrario, se la variabilità è piccola la distribuzione campionaria è non solo centrata

ma anche addensata sul parametro della popolazione e, di conseguenza, è alta la probabilità di

selezionare casualmente campioni con stime prossime al parametro della popolazione. Il grado di

addensamento della distribuzione campionaria intorno alla propria media è una proprietà che si

esprime con il termine precisione e si misura con un indice denominato errore standard. L'errore

standard è la radice quadrata della varianza della distribuzione campionaria delle stime. La stima

della varianza dello stimatore HT è data da: 2

  

( ) π π y y

∑ ∑ ( ) ( ) ( ) ( ) 

  −

= −

ˆ i j i j

v T 1  

 π π π

HT   

 ( )( ) ( ) ( )

∈ ∈ >

i c j c , j i i j i j

π > 0 .

dove ( )( )

i j

Nel campionamento con ripetizione si può utilizzare lo stimatore di Hansen-Hurwitz (HH)

y

∑ ( )

=

ˆ i

T in cui p è la probabilità di estrazione dell’unità i-esima. La stima della varianza

(i)

HH np ( )

i c i

dello stimatore è data da 2

 

( ) y

1 ∑ ( )

 

= −

ˆ ˆ

i

v T T

 

HH HH

n ( n 1

) p

 

( )

i c i 9

PDF created with pdfFactory trial version www.pdffactory.com

Quando il carattere di interesse è di tipo qualitativo oggetto di stima è la frequenza assoluta o

relativa delle unità della popolazione che possiedono un determinato attributo.

Se consideriamo un carattere dicotomico in cui l’unità o possiede l’attributo o non lo possiede, si

Λ Λ’ Λ

può pensare ad una popolazione suddivisa in due classi e tale che se l’unità appartiene a

variabile in esame assumerà modalità 1 (Y =1) altrimenti assumerà modalità 0 (Y =0).

i i

Ad esempio se la variabile Y è il sesso, si può considerare Y =0 se l’unità i-esima è maschio, Y =1

i i

se l’unità i-esima è femmina; se la variabile Y è il titolo di studio, si può considerare Y =0 se

i

l’unità i-esima è diplomato, Y =1 se l’unità i-esima non è diplomato.

i Λ

In tal caso la frequenza assoluta delle unità della popolazione che appartengono alla classe si può

N

= =

derivare dalla formula del totale T Y A , così come la frequenza relativa sarà ricavabile dalla

i

=1

i

N A

1 ∑

= = =

Y Y P . Si tratta quindi di stimare il valore totale A o il valore

formula della media i

N N

=1

i

medio P di una variabile che assume valori 0 e 1. 10

PDF created with pdfFactory trial version www.pdffactory.com

6. Campionamento casuale semplice

Il campionamento casuale semplice (CCS) costituisce il metodo di campionamento più elementare;

può avere valenza autonoma, ma viene più frequentemente utilizzato in congiunzione ad altre

tecniche.

Sebbene non sia molto diffuso nella pratica delle indagini, il campionamento casuale semplice

rappresenta il naturale punto di partenza per lo studio di tutti gli altri disegni campionari.

Il campionamento casuale semplice è la tecnica che attribuisce la stessa probabilità di selezione ad

ogni insieme di n unità distinte della popolazione: con tale tecnica si seleziona un campione di

numerosità n da una popolazione di N elementi, senza o con ripetizione, in modo tale che ogni

possibile campione abbia uguale probabilità di essere estratto.

Consegue che anche ogni singola unità della popolazione ha la stessa probabilità di entrare a far

parte del campione. I disegni di campionamento che possiedono questa ultima proprietà vengono

detti equiprobabilistici. Un disegno equiprobabilistico dà luogo ad un campione così detto

autoponderante.

Nella selezione di un campione casuale è possibile scegliere se ogni unità possa entrare più di una

volta nel campione. Se questa possibilità non è ammessa il campionamento è detto senza

ripetizione, altrimenti con ripetizione. Nella pratica, l'estrazione con ripetizione viene adottata

raramente.

Il CCS si caratterizza quindi per i seguenti elementi:

1. le unità di campionamento coincidono con le unità di rilevazione;

2. ciascuna unità possiede la stessa probabilità di inclusione nel campione (metodo

autoponderante);

3. qualsiasi sotto insieme di n elementi (campione) ha la stessa probabilità di estrazione.

Popo Campione

lazio

ne C.C.S n

N 11

PDF created with pdfFactory trial version www.pdffactory.com

6.1 Campionamento casuale semplice senza ripetizione

L’assenza di ripetizione significa che un’unità non può entrare a far parte dello stesso campione più

di una volta.

L’estrazione avviene attraverso un criterio sequenziale: 1

1. si seleziona un elemento dalla lista di N elementi con probabilità .

N

1

2. dai rimanenti N-1 elementi si seleziona un’unità con probabilità −

N 1

… 1

n. dai rimanenti N-n+1 elementi si seleziona un’unità con probabilità − +

N n 1

La via più immediata per attuare questo schema di campionamento è quella di ricorrere ad un’urna:

alle unità della popolazione, numerate da 1 a N, si fanno corrispondere altrettante palline recanti tali

numeri; inserite le palline nell’urna, si tratta di estrarre, una dopo l’altra e senza reinserimento, n

palline; faranno parte del campione le n unità individuate dai numeri delle palline estratte.

Nella realtà il procedimento di estrazione dall’urna viene simulato tramite la generazione di n

numeri casuali compresi fra 1 e N. Tale funzionalità di generazione di numeri casuali è presente in

molti software statistici e anche nel software Excel. 12

PDF created with pdfFactory trial version www.pdffactory.com

6.1.1 Piano di campionamento casuale semplice senza ripetizione

Il numero dei campioni distinti che possono essere estratti risulta pari a

 

N N !

=   =

C   −

N , n  

n ( N n )! n

! ⋅2 ⋅

La notazione k!, per k intero, denota il fattoriale di k: k! =k⋅(k - 1)⋅(k - 2)⋅... 1.

1

Ciascun campione ha una probabilità costante, pari a , di essere estratto. Quindi la probabilità

C N , n

di estrazione di un campione è −

1 1 ( )! !

N n n

= = =

( )

P c   !

N

N !

N

 

  −

( )! !

N n n

 

n

Probabilità di inclusione del primo ordine: ogni unità U della popolazione ha una probabilità di

i

inclusione nel campione costante e pari alla cosiddetta frazione di campionamento:

 

N 1

 

 

 

n 1

( ) n

=

π = ∈ =

P U c  

i i N N

 

 

 

n

Probabilità di inclusione del secondo ordine: ogni coppia di unità (U ;U ) della popolazione ha una

i j

probabilità di inclusione congiunta costante e pari a: −

 

2

N

 

  ( )

[ ] −

( )  

2

n 1

n n

=

π = ∈ =

,

P U U c ( )

 

i , j i j N N N 1

 

 

 

n 13

PDF created with pdfFactory trial version www.pdffactory.com

Esempio del campionamento casuale semplice senza ripetizione

Popolazione: Antonio, Bruno, Carla, Daniela

N = 4.

Campioni di dimensione n = 2

Universo dei campioni e probabilità di estrazione del campione

Campioni distinti

Antonio, Bruno

Antonio, Carla Bruno, Carla

Antonio, Daniela Bruno, Daniela Carla, Daniela

⋅ ⋅ ⋅

4

! 4

! 4 3 2 1 12

= = = = =

C 6 cardinalità dell’universo

− ⋅ ⋅ ⋅

4 , 2 ( 4 2 )!

2

! 2

!

2

! 2 1 2 1 2

1 1

= = = 0

,

167

P ( c ) probabilità di estrazione del campione

6

C

4 , 2

Probabilità di inclusione del primo e del secondo ordine 2

( ) ( ) ( ) ( )

π = ∈ = ∈ = ∈ = ∈ = =

P Antonio c P Bruno c P Carla c P Daniela c 0

,

5

i 4

[ ] [ ] [ ]

( ) ( ) ( )

π = ∈ = ∈ = ∈ =

P Antonio

, Bruno c P Antonio

, Carla c P Antonio

, Daniela c

i , j

[ ] [ ] [ ]

( ) ( ) ( ) 2 1 2 1

= ∈ = ∈ = ∈ = ⋅ = =

Bruno , Carla c P Bruno , Daniela c P Carla , Daniela c 4 3 12 6

6.1.2 Stimatori dei parametri della popolazione

Nel caso di campionamento casuale a probabilità costanti il riferimento alle etichette non è

necessario per cui si farà riferimento a y , y , …, y come al campione ordinato.

1 2 n

Per il campionamento casuale semplice senza ripetizione lo stimatore del totale è dato da:

n n n

y y N

∑ ∑ ∑

= = =

ˆ i i

T y

π i

n / N n

= = =

i 1 i 1 i 1

i

Il fattore N/n prende il nome di fattore di espansione: la stima dell’ammontare totale di un carattere

quantitativo è data dall’ammontare totale campionario moltiplicato per il fattore di espansione alla

popolazione. 14

PDF created with pdfFactory trial version www.pdffactory.com

La stima della varianza dello stimatore è data da − f

1

=

ˆ 2 2

v T N

( ) s

n

n ( )

1 n

= − =

2

2

dove s y y è la stima della varianza della popolazione e f è la frazione di

− i

n 1 N

=

i 1

campionamento.

Lo stimatore della media della popolazione è dato dalla media campionaria

n

1 ∑

ˆ = =

Y y y

i

n =

i 1

ˆ n n

T 1 N 1

∑ ∑

ˆ = = = =

Si ha infatti: y y y

Y i i

N N n n

= =

i 1 i 1 −

1 f

ˆ = 2

La stima della varianza dello stimatore è data da .

v (

Y ) s

n

L’errore standard dello stimatore è la radice quadrata della varianza. Quindi dopo aver stimato

l'errore standard del totale o della media è possibile, sotto certe condizioni, costruire un intervallo di

confidenza centrato su di essa, cioè individuare due valori, gli estremi dell'intervallo, che hanno una

prestabilita probabilità di contenere al loro interno il parametro della popolazione. Sotto ipotesi di

distribuzione normale del carattere o nel caso in cui il campione sia di numerosità elevata si può

assumere che l’intervallo di confidenza al 95% per il totale e per la media della popolazione siano

ˆ ˆ

± ±

ˆ ˆ

dati rispettivamente da T 1 . 96 v (

T ) e Y 1 . 96 v (

Y ) .

Quando il carattere di interesse è di tipo qualitativo oggetto di stima è la frequenza assoluta A o

relativa P delle unità della popolazione che possiedono un determinato attributo.

Mentre gli stimatori del totale e della media rimangono invariati, le formule relative alle varianze si

semplificano in quanto si ha −

1 f

= = −

ˆ

ˆ ˆ ˆ

2

v ( T ) v ( A

) N P (

1 P )

n 1

1 f

ˆ = = −

ˆ ˆ ˆ

v (

Y ) v ( P ) P (

1 P )

n 1 15

PDF created with pdfFactory trial version www.pdffactory.com

Esempio di stimatori nel campionamento casuale semplice senza ripetizione

Popolazione: Antonio, Bruno, Carla, Daniela

N = 4.

Campioni di dimensione n = 2

Distribuzione delle variabili Sesso e Reddito nella popolazione

Sesso:

i U(i) Sesso Reddito

dicotomico

Antonio M

1 0 50

Bruno M

2 0 70

Carla F

3 1 90

Daniela F

4 1 110

I parametri relativi alla popolazione sono i seguenti

Reddito totale 320

Reddito medio 80

Femmine totale 2

Proporzione di femmine 0.50

Per ognuno dei campioni dell’universo è possibile stimare il totale del reddito, il reddito medio e le

relative varianze: −

n

4 1 f

= = =

ˆ ˆ 2 2

v ( T ) 4 s

T y 4 y

i

2 2

=

i 1 −

1 f

ˆ ˆ

= = 2

v (

Y ) s

Y y 2

Stime dei parametri per i campioni dell’universo campionario: Varianza Standard error

Stime stimatore

U U y y Totale Media Totale Media Totale Media

1 2 1 2

Antonio Bruno 50 70 240 60 800 50 28 7

Antonio Carla 50 90 280 70 3.200 200 57 14

Antonio Daniela 50 110 320 80 7.200 450 85 21

Bruno Carla 70 90 320 80 800 50 28 7

Bruno Daniela 70 110 360 90 3.200 200 57 14

Carla Daniela 90 110 400 100 800 50 28 7

16

PDF created with pdfFactory trial version www.pdffactory.com

Gli stimatori sono corretti in quanto il loro valore atteso è uguale al parametro della popolazione:

Distribuzione campionaria degli stimatori

Totale Media Probabilità

240 60 0.17

280 70 0.17

320 80 0.33

360 90 0.17

400 100 0.17

() = ⋅ + ⋅ + ⋅ + ⋅ + ⋅ =

ˆ

E T 240 0 . 17 280 0 . 17 320 0 .

33 360 0 .

17 400 0 .

17 320

()

ˆ = ⋅ + ⋅ + ⋅ + ⋅ + ⋅ =

E Y 60 0 . 17 70 0 .

17 80 0 . 33 90 0 . 17 100 0 .

17 80

Analogamente per la stima del numero e della proporzione delle donne si ha:

Stime Varianza stimatore Standard error

U U y y Totale Percentuale Totale Percentuale Totale Percentuale

1 2 1 2

Antonio Bruno 0 0 0 0 0.0 0.0 0 0

Antonio Carla 0 1 2 0.5 2.0 0.1 1.41 0.35

Antonio Daniela 0 1 2 0.5 2.0 0.1 1.41 0.35

Bruno Carla 0 1 2 0.5 2.0 0.1 1.41 0.35

Bruno Daniela 0 1 2 0.5 2.0 0.1 1.41 0.35

Carla Daniela 1 1 4 1 0.0 0.0 0 0

Distribuzione campionaria degli stimatori

Totale PercentualeProbabilità

0 0 0.17

2 0.5 0.67

4 1 0.17

() = ⋅ + ⋅ + ⋅ =

ˆ

E A 0 0 .

17 2 0 .

67 4 0 .

17 2

() = ⋅ + ⋅ + ⋅ =

ˆ

E P 0 0 .

17 0 .

5 0 . 67 100 0 .

17 0 . 5 17

PDF created with pdfFactory trial version www.pdffactory.com

6.2 Campionamento casuale semplice con ripetizione

Si ha un campionamento casuale semplice con ripetizione quando vengono effettuate n estrazioni

indipendenti, tali che ogni unità della popolazione ha la stessa probabilità di essere estratta, pari a

1 . Una volta estratto, un elemento viene reinserito nella popolazione. Si tratta di una schema di

N

campionamento scarsamente usato nelle applicazioni.

6.2.1 Piano di campionamento del disegno casuale semplice con ripetizione = n

Il numero dei campioni ordinati con ripetizione che possono essere estratti risulta pari a C N

N , n

1

=

Ciascun campione ha una probabilità di essere estratto costante e pari a P ( c ) n

N

Probabilità di inclusione del primo ordine: ogni unità della popolazione ha una probabilità di

inclusione nel campione costante e pari a: − n

 

( ) N 1

π = ∈ = −  

P U c 1

i i  

N

Probabilità di inclusione del secondo ordine: ogni coppia di unità (U ;U ) della popolazione ha una

i j

probabilità di inclusione congiunta costante e pari a:

[ ] − −

n n

( )    

N 1 N 2

π = ∈ = − +

   

P U , U c 1 2

i , j i j    

N N 18

PDF created with pdfFactory trial version www.pdffactory.com

Esempio del campionamento casuale semplice con ripetizione

Popolazione: Antonio, Bruno, Carla, Daniela

N = 4.

Campioni di dimensione n = 2

Universo dei campioni e probabilità di estrazione del campione

Campioni ordinati

Antonio, Antonio Bruno, Antonio Carla, Antonio Daniela, Antonio

Antonio, Bruno Bruno, Bruno Carla, Bruno Daniela, Bruno

Antonio, Carla Bruno, Carla Carla, Carla Daniela, Carla

Antonio, Daniela Bruno, Daniela Carla, Daniela Daniela, Daniela

= =

2

4 16

C 4 , 2 1 1

= = = 0

,

0625

P ( c ) 16

C

4 , 2

Probabilità di inclusione del primo e del secondo ordine

( ) ( ) ( ) ( )

π = ∈ = ∈ = ∈ = ∈ =

P Antonio c P Bruno c P Carla c P Daniela c

i − 2 2

 4 1 3 9 7

= − =

= −

= − 

1 1 1

 4 4 16 16

[ ] [ ] [ ]

( ) ( ) ( )

π = ∈ = ∈ = ∈ =

P Antonio

, Bruno c P Antonio

, Carla c P Antonio

, Daniela c

i , j

[ ] [ ] [ ]

( ) ( ) ( )

= ∈ = ∈ = ∈ =

Bruno , Carla c P Bruno , Daniela c P Carla , Daniela c

− −

2 2 2 2

        9 4 4 1

4 1 4 2 3 2

= − + = − + = − + = =

       

1 2 1 2 1 2

       

4 4 4 4 16 16 16 8 19

PDF created with pdfFactory trial version www.pdffactory.com


PAGINE

39

PESO

257.75 KB

AUTORE

Teemo92

PUBBLICATO

+1 anno fa


DESCRIZIONE DISPENSA

In questa dispensa di Statistica, a cura della professoressa Lara Fontanella, ci si occupa del campionamento. La dispensa è strutturata nel seguente modo:
- L'indagine campionaria;
- Popolazione e campione;
- Campionamento probabilistico e non probabilistico;
- Campionamento probabilistico: strategia di campionamento e disegno di campionamento;
- La stima delle caratteristiche della popolazione;
- Campionamento casuale semplice;
- Campionamento sistematico;
- Campionamento stratificato;
- Campionamento a grappoli;
- Campionamento a due stadi.


DETTAGLI
Corso di laurea: Corso di laurea magistrale in management delle politiche e dei servizi sociali
SSD:
A.A.: 2009-2010

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher Teemo92 di informazioni apprese con la frequenza delle lezioni di Metodi Statistici per la valutazione delle politiche sociali e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Gabriele D'Annunzio - Unich o del prof Fontanella Lara.

Acquista con carta o conto PayPal

Scarica il file tutte le volte che vuoi

Paga con un conto PayPal per usufruire della garanzia Soddisfatto o rimborsato

Recensioni
Ti è piaciuto questo appunto? Valutalo!

Altri appunti di Corso di laurea magistrale in management delle politiche e dei servizi sociali

Dispensa di Statistica, metodi statistici per la valutazione delle politiche sociali
Dispensa
Dispensa di Statistica, metodi statistici per la valutazione delle politiche sociali (seconda parte)
Dispensa