Anteprima
Vedrai una selezione di 5 pagine su 18
Appunti del corso di Metodi statistici in preparazione dell'autovalutazione Pag. 1 Appunti del corso di Metodi statistici in preparazione dell'autovalutazione Pag. 2
Anteprima di 5 pagg. su 18.
Scarica il documento per vederlo tutto.
Appunti del corso di Metodi statistici in preparazione dell'autovalutazione Pag. 6
Anteprima di 5 pagg. su 18.
Scarica il documento per vederlo tutto.
Appunti del corso di Metodi statistici in preparazione dell'autovalutazione Pag. 11
Anteprima di 5 pagg. su 18.
Scarica il documento per vederlo tutto.
Appunti del corso di Metodi statistici in preparazione dell'autovalutazione Pag. 16
1 su 18
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

PESI DA MANCATE RISPOSTE PARZIALI:

la probabilità che l’s esima unità risponda alla r esima

E’ necessario introdurre

domanda:

In particolare il primo fattore è la probabilità di inclusione ed il secondo è la

probabilità di risposta condizionata a quella di inclusione.

Il calcolo di quest’ultimo fattore dipende dal meccanismo di non risposta dietro a

3 meccanismi di non risposta:

ciascun individuo, in particolare si sono ipotizzati

Completely missing at random

- (MCAR).

dovuta al caso

La non risposta è senza sistematicità.

o n_r = numerosità di chi risponde

n = numerosità del campione

- Missing at random (MAR): per via di una specifica modalità in una

L’individuo non risponde

o caratteristica:

n_r,x = numerosità di chi risponde pur avente l’x esima modalità della

caratteristica

n_x = numerosità del campione avente l’x esima modalità

- Not missing at random (NMAR): sia per dei tratti latenti che per il tema trattato

L’individuo non risponde

o nell’item analizzato. Si cerca di riportarsi il più possibile ad un modello

MAR cercando più informazioni possibili per avere previsioni sulla

risposta. peso da mancate risposte parziali

In conclusione, si ha un pari a:

peso globale dato dal prodotto dei tre pesi

Possiamo definire il studiati:

Se la somma dei pesi per tutte le unità è pari alla numerosità della popolazione allora

pesi di riporto all’universo,

si parla di come nel caso del campionamento casuale

semplice.

se è pari alla numerosità del campione pesi

Invece, tale somma si definiscono

standardizzati, come nel caso di Gallup.

MARGINE DI ERRORE:

p percentuale della popolazione

Sia dato il parametro incognito che rappresenta la

che risponderebbe affermativamente ad un determinato items .

^

p p percentuale di risposte affermative

E sia lo stimatore di , ovvero la che

campione osservato.

emerge dal

Sotto le ipotesi di indipendenza ( le risposte sono indipendenti se i rispondenti non

la variabile casuale si distribuisce come una

sono influenzati tra di loro) e normalità, n

normale per un numero sufficientemente alto di campioni :

( )

2

^

p N p , S p

Essendo che si distribuisce come una binomiale

il parametro incognito ho che

2 sarà dato da:

S ( )

p 1−p

2 =

S n

In genere si aggiunge un fattore di correzione per popolazione finite che a zero al

crescere della numerosità campionaria e quindi si trascura il più delle volte.

( )

2

^ )S

p N p ,(1−f

n

=1−

1−f → 0

N l’intervallo di

A partire dalla distribuzione dello stimatore andiamo ad osservare

confidenza:

[ ]

√ ^ ^

( )

p 1− p

^

p∈ p ± z α n

2

In particolare si ha: √ ( )

^ ^

p 1− p

ERRORE STANDARD: =

σ ^

p n √ ( )

^ ^

p 1− p

z

MARGINE DI ERRORE o ERRORE CAMPIONARIO: α n

2

√ ( )

^ ^

p 1− p

z

Se si ha un errore campionario di significa che se l’indagine fosse stata

α n

2 p

fatta 100 volte usando la stessa identica procedura, cadrebbe 95 volte su 100

[ ]

√ ^ ^

( )

p 1− p

^

p ± z

dentro un intervallo di .

α n

2

L’analisi dinamica all’aumentare della numerosità

ci porta a concludere che

campionaria il margine di errore si riduce. ^

p

all’aumentare della percentuale affermativa dei rispondenti ( )

Viceversa, si

aumento del margine di errore.

osserva un ^

p

Come capire se è associata una numerosità abbastanza grande per

al parametro

affermare che si distribuisce come una normale?

regola di successo fallimento

Sfruttando il teorema di Chebyshev si ottiene la

sintetizzata dal seguente sistema da rispettare:

{ ⋅ ^

n p ≥10

( )

^

n⋅ 1− p ≥ 10 EUROBAROMETRO:

A partire dal 1973 in seguito alla decisione presa dalla Commissione Europea, l’Ufficio

Statistico dell’Unione Europea (Eurostat) conduce regolarmente una serie di sondaggi

di opinione pubblica in tutti gli Stati membri dell’UE, il cosiddetto Eurobarometro.

PIANO DI CAMPIONAMENTO:

popolazione di riferimento sono i cittadini residenti in Europa

Generalmente la che

buona conoscenza della lingua locale con età superiore ai 15 anni.

abbiano una e

piano di campionamento a due stadi con una

Si ha un di tipo probabilistico

stratificazione a doppio strato: il primo è uno strato territoriale, in base ad un criterio

(NUTS 2), il secondo

comune a tutti i paesi europei ed per conformazione geo politica

(area metropolitana, urbana e rurale). unità territoriale la singola unità del

Si definisce

secondo strato. UPS ( unità di primo stadio)

Da ciascuna unità territoriale si estraggono le che

comuni

rappresentano grandi o insieme di comuni. Presi convenzionalmente per via

Da ciascuno stato

della facilità di risalire alle famiglie residenti tramite liste elettorali.

circa 100 UPS tramite un modo casuale detto PPS proporzionale

vengono estratte (

alla grandezza demografica dello strato). unità di secondo stadio (indirizzi di

A loro volta, per estrarre da ciascun UPS le

abitazioni) campionamento casuale il

si ricorre ad un nel seguente modo: estratto

primo indirizzo si selezionano i successivi tramite una procedura di “Random Route”.

E’ un percorso casuale dato dalla selezione dell’ n esimo indirizzo a partire dal primo.

l’unità statistica è la famiglia

In conclusione, definiamo e di rilevazione: la prima

associata all’indirizzo estratto (ad ogni indirizzo corrisponde una ed una sola famiglia),

l’unità di rilevazione è l’individuo da intervistare estratto con la

mentre della famiglia

regola del compleanno più vicino. PESI CAMPIONARI:

I tre principali sistemi di ponderazione presenti nelle indagini Eurobarometro sono:

Pesi da disegno:

-

Necessari unità di rilevazione hanno una diversa probabilità di

per il fatto che le

inclusione dovuta alle diverse numerosità delle famiglie. Infatti, un individuo che

appartiene ad una famiglia numerosa ha una probabilità di inclusione più bassa

rispetto ad un individuo che vive in una famiglia composta da sole due persone.

Pesi di post stratificazione:

-

necessità deriva dal fatto che, in seguito a

La di ricorrere ai pesi di post stratificazione

mancate risposte totali, alcune caratteristiche nel campione si distribuiscono in modo

diverso rispetto alla popolazione. Assumendo note le caratteristiche relative alla

struttura della popolazione di riferimento (quali età, genere e popolazione che son

fornite da Eurostat), le proporzioni presenti nella popolazione sono ristabilite all’interno

del campione osservato attraverso l’utilizzo dei pesi post stratificazione.

- Pesi di popolazione:

Ogni nazione ha un peso di popolazione per un equa rappresentazione rispetto alla

propria ampiezza demografica. Nel dettaglio, si ha una differenza troppo ampia della

probabilità di inclusione tra una famiglia in Lussemburgo ed una in Germania per via

si applicano

della stessa quantità di UPS per ogni stato. In sintesi, i pesi di popolazione

al fine di non sovra stimare le piccole nazioni .

Nei dataset pubblici fornisce due pesi:

l’Eurostat principali tipologie di

W1: prodotto tra i pesi di post stratificazione e pesi da disegno

- E’ il . Il W1 è

confronti interni ad uno stesso stato.

necessario per

WEX: prodotto tra W1 ed i pesi di popolazione necessario per il

- E’ il . Il WEX è

confronto internazionale.

sommatoria restituisce la numerosità della

La di tutti i pesi WEX

o popolazione di riferimento.

GALLUP WORLD POLL:

La Gallup World Poll è una delle più importanti indagini svolte dalla società Gallup

International: sono indagini commissionate da organizzazioni mondiali, come FAO o

UNCEF, selezionando dati Cross Section per campioni indipendenti da ciascun paese.

L’unità di rivelazione è il singolo individuo intervistato.

In particolare, le indagini vengono definite omogenee sia sul piano del campionamento

che sul questionario, ciò è essenziale per il confronto internazionale e temporale.

PIANO DI CAMPIONAMENTO:

due piani di campionamento: per intervista face to face o per

Ci sono principali

intervista telefonica. L’ intervista telefonica si ha in quei paesi sviluppati in cui la

copertura telefonica è superiore all’ 80%.

faccia a faccia:

Intervista

piano di campionamento di tipo probabilistico a due stadi con

Si applica un

stratificazione. stratificazione su densità demografica e/o su regioni

La è basata

fisiche/politiche.

Da ciascuno strato si estraggono (UPS)

le unità di primo stadio che sono aree

provincie. L’estrazione dipende dalle informazioni disponibili

metropolitane o delle UPS

riguardo la densità demografica.

- Ci sono informazioni demografiche sulla densità delle UPS?

SI:

o probabilità proporzionale alla

Si estraggono le UPS associandoli una

densità demografica. 33 UPS per ciascun paese.

Circa

Ci sono informazioni demografiche sulle unità di secondo stadio ?

SI:

 Sfruttando il PPS, estraggo

da ciascuna UPS selezionata delle unità

CAP). 100 125 per

di secondo stadio (ad esempio il Tra le e le

ciascun paese.

NO:

 un’estrazione casuale

l’estrazione delle unità di secondo stadio è

semplice.

NO:

o entrambe le estrazioni, sia delle UPS che delle unità di secondo stadio, è

casuale semplice.

La famiglia da intervistare si seleziona applicando la regola del 3 : da un punto di

riferimento (una piazza o una chiesa come esempio) si seleziona un’abitazione ogni 3

indirizzi. Da ciascuna unità di secondo stadio ho 10 famiglie da intervistare. Per

ciascuna famiglia selezionata, gli intervistatori fanno tre tentativi per poi passare

all’indirizzo successivo.

OSS: Se si dovesse incontrare un condominio si seleziona l’ultimo piano come punto di

partenza e poi si procede al solito per multipli di tre, in senso orario verso il piano

terra.

L’individuo da intervistare all’interno della famiglia si individua attraverso la tabella di

Kis

Dettagli
Publisher
A.A. 2023-2024
18 pagine
SSD Scienze economiche e statistiche SECS-S/01 Statistica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher Dinamo02 di informazioni apprese con la frequenza delle lezioni di Metodi statistici per le analisi di mercato e di opinione e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Roma La Sapienza o del prof Pittau Mariagrazia.