vuoi
o PayPal
tutte le volte che vuoi
PESI DA MANCATE RISPOSTE PARZIALI:
la probabilità che l’s esima unità risponda alla r esima
E’ necessario introdurre
domanda:
In particolare il primo fattore è la probabilità di inclusione ed il secondo è la
probabilità di risposta condizionata a quella di inclusione.
Il calcolo di quest’ultimo fattore dipende dal meccanismo di non risposta dietro a
3 meccanismi di non risposta:
ciascun individuo, in particolare si sono ipotizzati
Completely missing at random
- (MCAR).
dovuta al caso
La non risposta è senza sistematicità.
o n_r = numerosità di chi risponde
n = numerosità del campione
- Missing at random (MAR): per via di una specifica modalità in una
L’individuo non risponde
o caratteristica:
n_r,x = numerosità di chi risponde pur avente l’x esima modalità della
caratteristica
n_x = numerosità del campione avente l’x esima modalità
- Not missing at random (NMAR): sia per dei tratti latenti che per il tema trattato
L’individuo non risponde
o nell’item analizzato. Si cerca di riportarsi il più possibile ad un modello
MAR cercando più informazioni possibili per avere previsioni sulla
risposta. peso da mancate risposte parziali
In conclusione, si ha un pari a:
peso globale dato dal prodotto dei tre pesi
Possiamo definire il studiati:
Se la somma dei pesi per tutte le unità è pari alla numerosità della popolazione allora
pesi di riporto all’universo,
si parla di come nel caso del campionamento casuale
semplice.
se è pari alla numerosità del campione pesi
Invece, tale somma si definiscono
standardizzati, come nel caso di Gallup.
MARGINE DI ERRORE:
p percentuale della popolazione
Sia dato il parametro incognito che rappresenta la
che risponderebbe affermativamente ad un determinato items .
^
p p percentuale di risposte affermative
E sia lo stimatore di , ovvero la che
campione osservato.
emerge dal
Sotto le ipotesi di indipendenza ( le risposte sono indipendenti se i rispondenti non
la variabile casuale si distribuisce come una
sono influenzati tra di loro) e normalità, n
normale per un numero sufficientemente alto di campioni :
( )
2
^
p N p , S p
Essendo che si distribuisce come una binomiale
il parametro incognito ho che
2 sarà dato da:
S ( )
p 1−p
2 =
S n
In genere si aggiunge un fattore di correzione per popolazione finite che a zero al
crescere della numerosità campionaria e quindi si trascura il più delle volte.
( )
2
^ )S
p N p ,(1−f
n
=1−
1−f → 0
N l’intervallo di
A partire dalla distribuzione dello stimatore andiamo ad osservare
confidenza:
[ ]
√ ^ ^
( )
p 1− p
⋅
^
p∈ p ± z α n
2
In particolare si ha: √ ( )
^ ^
p 1− p
ERRORE STANDARD: =
σ ^
p n √ ( )
^ ^
p 1− p
⋅
z
MARGINE DI ERRORE o ERRORE CAMPIONARIO: α n
2
√ ( )
^ ^
p 1− p
⋅
z
Se si ha un errore campionario di significa che se l’indagine fosse stata
α n
2 p
fatta 100 volte usando la stessa identica procedura, cadrebbe 95 volte su 100
[ ]
√ ^ ^
( )
p 1− p
⋅
^
p ± z
dentro un intervallo di .
α n
2
L’analisi dinamica all’aumentare della numerosità
ci porta a concludere che
campionaria il margine di errore si riduce. ^
p
all’aumentare della percentuale affermativa dei rispondenti ( )
Viceversa, si
aumento del margine di errore.
osserva un ^
p
Come capire se è associata una numerosità abbastanza grande per
al parametro
affermare che si distribuisce come una normale?
regola di successo fallimento
Sfruttando il teorema di Chebyshev si ottiene la
sintetizzata dal seguente sistema da rispettare:
{ ⋅ ^
n p ≥10
( )
^
n⋅ 1− p ≥ 10 EUROBAROMETRO:
A partire dal 1973 in seguito alla decisione presa dalla Commissione Europea, l’Ufficio
Statistico dell’Unione Europea (Eurostat) conduce regolarmente una serie di sondaggi
di opinione pubblica in tutti gli Stati membri dell’UE, il cosiddetto Eurobarometro.
PIANO DI CAMPIONAMENTO:
popolazione di riferimento sono i cittadini residenti in Europa
Generalmente la che
buona conoscenza della lingua locale con età superiore ai 15 anni.
abbiano una e
piano di campionamento a due stadi con una
Si ha un di tipo probabilistico
stratificazione a doppio strato: il primo è uno strato territoriale, in base ad un criterio
(NUTS 2), il secondo
comune a tutti i paesi europei ed per conformazione geo politica
(area metropolitana, urbana e rurale). unità territoriale la singola unità del
Si definisce
secondo strato. UPS ( unità di primo stadio)
Da ciascuna unità territoriale si estraggono le che
comuni
rappresentano grandi o insieme di comuni. Presi convenzionalmente per via
Da ciascuno stato
della facilità di risalire alle famiglie residenti tramite liste elettorali.
circa 100 UPS tramite un modo casuale detto PPS proporzionale
vengono estratte (
alla grandezza demografica dello strato). unità di secondo stadio (indirizzi di
A loro volta, per estrarre da ciascun UPS le
abitazioni) campionamento casuale il
si ricorre ad un nel seguente modo: estratto
primo indirizzo si selezionano i successivi tramite una procedura di “Random Route”.
E’ un percorso casuale dato dalla selezione dell’ n esimo indirizzo a partire dal primo.
l’unità statistica è la famiglia
In conclusione, definiamo e di rilevazione: la prima
associata all’indirizzo estratto (ad ogni indirizzo corrisponde una ed una sola famiglia),
l’unità di rilevazione è l’individuo da intervistare estratto con la
mentre della famiglia
regola del compleanno più vicino. PESI CAMPIONARI:
I tre principali sistemi di ponderazione presenti nelle indagini Eurobarometro sono:
Pesi da disegno:
-
Necessari unità di rilevazione hanno una diversa probabilità di
per il fatto che le
inclusione dovuta alle diverse numerosità delle famiglie. Infatti, un individuo che
appartiene ad una famiglia numerosa ha una probabilità di inclusione più bassa
rispetto ad un individuo che vive in una famiglia composta da sole due persone.
Pesi di post stratificazione:
-
necessità deriva dal fatto che, in seguito a
La di ricorrere ai pesi di post stratificazione
mancate risposte totali, alcune caratteristiche nel campione si distribuiscono in modo
diverso rispetto alla popolazione. Assumendo note le caratteristiche relative alla
struttura della popolazione di riferimento (quali età, genere e popolazione che son
fornite da Eurostat), le proporzioni presenti nella popolazione sono ristabilite all’interno
del campione osservato attraverso l’utilizzo dei pesi post stratificazione.
- Pesi di popolazione:
Ogni nazione ha un peso di popolazione per un equa rappresentazione rispetto alla
propria ampiezza demografica. Nel dettaglio, si ha una differenza troppo ampia della
probabilità di inclusione tra una famiglia in Lussemburgo ed una in Germania per via
si applicano
della stessa quantità di UPS per ogni stato. In sintesi, i pesi di popolazione
al fine di non sovra stimare le piccole nazioni .
Nei dataset pubblici fornisce due pesi:
l’Eurostat principali tipologie di
W1: prodotto tra i pesi di post stratificazione e pesi da disegno
- E’ il . Il W1 è
confronti interni ad uno stesso stato.
necessario per
WEX: prodotto tra W1 ed i pesi di popolazione necessario per il
- E’ il . Il WEX è
confronto internazionale.
sommatoria restituisce la numerosità della
La di tutti i pesi WEX
o popolazione di riferimento.
GALLUP WORLD POLL:
La Gallup World Poll è una delle più importanti indagini svolte dalla società Gallup
International: sono indagini commissionate da organizzazioni mondiali, come FAO o
UNCEF, selezionando dati Cross Section per campioni indipendenti da ciascun paese.
L’unità di rivelazione è il singolo individuo intervistato.
In particolare, le indagini vengono definite omogenee sia sul piano del campionamento
che sul questionario, ciò è essenziale per il confronto internazionale e temporale.
PIANO DI CAMPIONAMENTO:
due piani di campionamento: per intervista face to face o per
Ci sono principali
intervista telefonica. L’ intervista telefonica si ha in quei paesi sviluppati in cui la
copertura telefonica è superiore all’ 80%.
faccia a faccia:
Intervista
piano di campionamento di tipo probabilistico a due stadi con
Si applica un
stratificazione. stratificazione su densità demografica e/o su regioni
La è basata
fisiche/politiche.
Da ciascuno strato si estraggono (UPS)
le unità di primo stadio che sono aree
provincie. L’estrazione dipende dalle informazioni disponibili
metropolitane o delle UPS
riguardo la densità demografica.
- Ci sono informazioni demografiche sulla densità delle UPS?
SI:
o probabilità proporzionale alla
Si estraggono le UPS associandoli una
densità demografica. 33 UPS per ciascun paese.
Circa
Ci sono informazioni demografiche sulle unità di secondo stadio ?
SI:
Sfruttando il PPS, estraggo
da ciascuna UPS selezionata delle unità
CAP). 100 125 per
di secondo stadio (ad esempio il Tra le e le
ciascun paese.
NO:
un’estrazione casuale
l’estrazione delle unità di secondo stadio è
semplice.
NO:
o entrambe le estrazioni, sia delle UPS che delle unità di secondo stadio, è
casuale semplice.
La famiglia da intervistare si seleziona applicando la regola del 3 : da un punto di
riferimento (una piazza o una chiesa come esempio) si seleziona un’abitazione ogni 3
indirizzi. Da ciascuna unità di secondo stadio ho 10 famiglie da intervistare. Per
ciascuna famiglia selezionata, gli intervistatori fanno tre tentativi per poi passare
all’indirizzo successivo.
OSS: Se si dovesse incontrare un condominio si seleziona l’ultimo piano come punto di
partenza e poi si procede al solito per multipli di tre, in senso orario verso il piano
terra.
L’individuo da intervistare all’interno della famiglia si individua attraverso la tabella di
Kis