vuoi
o PayPal
tutte le volte che vuoi
Il campionamento per quote è tra i più
usati. Un campione per quote si
costruisce suddividendo l’intera
popolazione in gruppi omogenei, ad
esempio secondo il sesso, l’età, la
residenza e così via (costruiti su una
serie di variabili di vario genere); si
calcola il peso di ciascun gruppo
all’interno della popolazione. Il
campione deve quindi rispecchiare le
quote calcolate sulla popolazione
complessiva e su questa base, una
volta prefissata la numerosità
campionaria, è automaticamente
prefissata il numero di elementi da
inserire in ciascuna quota. È un tipo di
campionamento non probabilistico,
dove bisogna fare in modo che le quote
dei diversi gruppi nel campione siano
uguali alle quote dei diversi gruppi
della popolazione.
La formazione del campione casuale (o
probabilistico) segue un percorso molto
diverso. Il procedimento equivale
all’estrazione da un’urna di palline. La
composizione dell’urna è assimilabile
alla popolazione oggetto di studio.
Con la selezione casuale si è garantiti
che l’operatore non incida sulla
composizione del campione.
Il campione casuale permette di
costruire un modello matematico che
utilizza il calcolo delle probabilità e il
calcolo combinatorio per impostare su
basi razionali la scelta tra varie
strategie possibili; permette quindi di
calcolare le stime della popolazione…
cosa che invece non può essere fatta
con i campioni di tipo non
probabilistico.
Il campione casuale è sempre
rappresentativo della popolazione.
Il modello matematico consente anche
di valutare in termini probabilistici
l’attendibilità dei risultati, elemento
impossibile per i campioni a scelta
ragionata. E’ chiaro che solo se il
campione è casuale è possibile
calcolare la probabilità dell’errore a cui
si va incontro nella stima delle
caratteristiche di interesse (errore
casuale di campionamento).
La selezione di un campione
probabilistico avviene con scelta
casuale o sistematica. Un campione
selezionato casualmente è solo un
risultato tra i tanti possibili (universo
dei campioni). L’inevitabile margine di
errore che accompagna i risultati di
un’indagine campionaria richiede che
la loro presentazione sia corredata da
informazioni che ne consentano una
lettura corretta.
Il modo più semplice di formare un
campione probabilistico da una
popolazione costituita di un numero
finito di elementi consiste nel
selezionarne casualmente un numero
prestabilito in modo tale da garantirsi
che tutti i possibili campioni di uguale
numero abbiano la stessa possibilità di
essere selezionati. Tale condizione è
rispettata quando si procede alla
selezione delle unità campionarie
n
estraendo in un’unica soluzione
palline da un’urna che ne contiene N, o
estraendole una alla volta senza mai
rimettere le palline estratte nell’urna
(estrazione in blocco o campione causle
senza ripetizione). Alternativo a questo
procedimento è l’estrazione con
ripetizione, che consiste nel
reintrodurre la pallina nell’urna dopo
che è stata estratta. Un modo per
simulare l’estrazione casuale di un
n
numero di elementi pari a è quello di
n
procedere alla generazione di numeri
pseudo-casuali compresi nell’intervallo
[1, N].
Un’alternativa è rappresentata dalla
selezione campionaria con passo
sistematico. In altri termini, se si vuole
N
estrarre da una popolazione di
n
elementi un campione di unità, posto:
N/n = k
k
(con detto passo di campionamento)
si seleziona casualmente da un’urna
k
contenente i primi numeri naturali un
r)
numero (indicato con detto numero
di partenza. Questo numero
contrassegna il posto occupato dalla
prima unità campionaria. Dopo l’unità
r k
che occupa il posto si contano
posizioni successive e poi si seleziona
(r+k)
l’unità che occupa il posto e poi
via via quelle che occupano i posti
(r+2k), (r+3k) etc. Solo se l’ordine delle
unità nella lista è casuale il campione
sistematico equivale a quelli selezionati
tramite estrazione delle unità.
Tecniche di campionamento complesse.
Tra le tecniche principali vi sono il
campionamento casuale stratificato, il
campionamento casuale a grappoli e
quello casuale a due o più stadi.
L’operazione di stratificazione consiste
nella suddivisione della popolazione in
k gruppi (o strati) all’interno dei quali le
unità risultino tendenzialmente
omogenee. Da ogni strato si procede
poi all’estrazione di un campione
casuale semplice. Se è legittimo
supporre che esista una relazione tra le
variabili di stratificazione e i parametri
da stimare, l’operazione riduce la
variabilità delle stime. Maggiori dettagli
verranno forniti nella lezione
successiva.
Il campionamento casuale a grappoli è
un criterio suggerito di norma dalle
caratteristiche della popolazione. Viene
utilizzato a condizione che la
popolazione sia suddivisa o
suddivisibile in sottoinsiemi o segmenti
di elementi legati da vincoli di
contiguità spaziale o di altro tipo. Si
procede alla selezione casuale di un
dato numero di grappoli e quindi alla
rilevazione di tutte le unità comprese
nel grappolo o di un campione casuale
semplice delle stesse (campionamento
a due stadi).
Il campionamento a due o più stadi si
adatta soprattutto alle grandi
rilevazioni del tipo delle indagini
nazionali sui consumi delle famiglie o
sulle forze di lavoro. In questi casi è
preferibile prima estrarre un gruppo di
comuni, che rappresentano grappoli di
unità elementari e poi prelevare da
ciascuno di questi un numero
prestabilito di unità elementari
(famiglie).In questo caso, oltre ad
ovviare alle difficoltà connesse con la
formazione della lista, si conseguono
vantaggi organizzativi, i quali tuttavia
possono attenuarsi di molto se i
grappoli non sono al loro interno
tendenzialmente omogenei, a causa
dell’elevata variabilità campionaria
delle stime.
L’inconveniente può essere superato
ricorrendo alla stratificazione delle
unità di primo stadio.
CCS= campione casuale semplice
Popolazione: P
Il campione classico può essere
estratto con ripetizione, ovvero una
volta estratto viene rimesso nell’urna
della popolazione; quindi è possibile
che la stessa unita venga campionata
più volte, questo è inutile perché non
porta nessuna nuova informazione,
quindi per evitare questa problematica
si usa il campionamento senza
ripetizione (o campionamento in
blocco) che equivale all’estrarre in un
unico blocco tutti gli elementi che
fanno parte del campione. La variabilità
degli stimatori che ricaviamo dal
campione casuale con ripetizione è più
bassa rispetto alla variabilità del
campionamento con ripetizione. Sia nel
caso con che senza ripetizione gli
stimatori sono gli stessi, cambia la
varianza delle stime perché nel caso
con ripetizione è sigma 2 diviso n,
mentre nell’altro caso è data da sigma
2 diviso n per N-n diviso n-1 (si chiama
fattore di correzione per la popolazione
finita). Foto
Nel caso del campionamento con
ripetizione, essendo che rimettiamo
l’unità estratta nell’urna è come se la
popolazione fosse infinita.
Dopo il campionamento casuale
semplice ci sono altri piani di
campionamento più complessi come il
campionamento stratificato. La
possibilità di stratificare è connessa alla
qualità della nostra lista. Inoltre
possono esserci delle informazioni
complementari che possono aiutare a
suddividere la popolazione in strati di
gruppi omogenei rispetto ad una
variabile che si chiama variabile
ausiliare (variabile di stratificazione).
Una volta fatta questa operazione si
determina sempre la numerosità del
campione e si vanno a fare tanti
campioni casuali semplici quanti sono
gli strati, e per ogni strato calcoliamo la
media aritmetica di strato (X- j) -> x
medio j
Poi calcoliamo la stima della media per
tutta la popolazione e la costruiamo
come combinazione lineare delle medie
di ciascuno strato. Facciamo quindi i
pesi degli strati nella popolazione.
Il campionamento stratificato ha due
caratteristiche: è utile impiegarlo
quando gli strati che noi identifichiamo
hanno anche degli interessi conosciti di
per sé (ci interessa conoscere
determinate caratteristiche, un
determinato sottogruppo della
popolazione che coincide con gli strati
-> obiettivo sostanziale conoscitivo). Il
secondo elemento da considerare è di
carattere tecnico: si dimostra che la
variabilità dello stimatore del
campionamento stratificato è sempre
minore o uguale alla variabilità di uno
stimatore che deriva da un campione
casuale semplice.
Quindi possiamo avere stime più
precise rispetto al campione casuale
semplice a parità di numerosità
campionaria oppure possiamo ridurre la
numerosità campionaria ottenendo
sempre la stessa precisione che
avevano con il campione casuale
semplice.
La varianza T può essere divisa in
varianza W + varianza B. Definite
varianza di twin e ?
Nel campionamento stratificato
eliminiamo per costruzione la varianza
di twin, per cui tanto più saranno
diverse le medie di strato, tanto più
sarà il guadagno di precisione che
ricaviamo dal campionamento
stratificato. Se le medie di strato
fossero tutte uguali, il vantaggio
sarebbe solo quello di studiare in
dettaglio gli strati.
Altro schema da considerare è quello
del campionamento a grappoli, che
possiamo utilizzare quando non
abbiamo la lista delle unità che fanno
parte della popolazione. La nostra
popolazione è naturalmente
raggruppata in unità maggiori che
possiamo identificare, per esempio
un’indagine sulla customer satisfaction
degli utenti di tper dell’emilia romagna.
Si considerano le diverse corse come
grappoli, unità campionarie di primo
stadio e poi decidiamo se intervistare
tutte le unità su quella corsa o fare un
campione ca