Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
Campionamento con ripetizione e senza ripetizione
Unità statistiche tutte stessa probabilità di essere incluse nel campione (con ripetizione) o di essere estratte (senza ripetizione).
La popolazione, mano a mano che si estraggono le unità, rimane sempre N.
N° di campioni ordinati: N! / (N-n)!
N° di campioni non ordinati: (N+n-1)! / (n!(n-1)!)
Campionamento casuale stratificato
Popolazione divisa in un certo numero di sottopopolazioni, dette strati;
Al loro interno contengono delle unità che sono simili tra loro per aspetto a una o più caratteristiche definite dal ricercatore;
Da ogni strato si estrae un campione casuale semplice;
Si ottengono tanti piccoli campioni quanti sono gli strati e ogni piccolo campione può avere una
numerosità diversa dagli altri; Infine, tutte le unità estratte da ogni strato vengono messe insieme a formare il campione vero e proprio; CASUALE A GRAPPOLI Quando la pop. è naturalmente divisa in gruppi di unità contigue, chiamati grappoli Si sceglie casualmente senza ripetizione un certo numero di grappoli; Poi si includono nel campione tutte le unità statistiche che fanno parte dei grappoli estratti; Non è possibile sapere a priori la numerosità del campione; SCOPO: contenimento dei costi della rivelazione SISTEMATICO CAMPIONAMENTO Le unità vengono estratte scorrendo la lista e selezionando sistematicamente una unità ad ogni intervallo N1. Si calcola prima il passo di campionamento k = n/N. Si estrae un numero casuale tra 1 e k. Questo stabilisce casualmente la prima unità della lista da estrarre; Si procede ad estrarre le rimanenti unità prendendo dalla lista una unità ogni k.- 2 O PIU' STADI
La popolazione è divisa in più livelli gerarchizzati casualmente ordinati
In un campionamento a due stadi si hanno:
- Le unità del primo stadio (primarie);
- Le unità del secondo stadio (secondarie)
Al primo stadio si estrae, secondo una tecnica, un campione senza ripetizione
Queste unità sono dei grappoli, però qui non si prendono tutte le unità, ma si estraggono solo alcune, che vengono dette unità di secondo stadio
CON PROBABILITA' VARIABILI
CAMPIONAMENTO
Si immagini di realizzare un'indagine sul reddito percepito dalle famiglie in un quartiere, dove sono presenti poche famiglie facoltose e molte famiglie meno abbienti.
Ogni famiglia avrà una probabilità di estrazione diversa e proporzionale alla grandezza del suo appartamento
CAMPIONAMENTO NON PROBABILISTICI
VANTAGGI
- Meno costosi, più rapidi da applicare;
SVANTAGGI
- I risultati ottenuti non sono estendibili a
Selezione
campione avviene a criteri di tutta la popolazione (non si può fare comodo o di praticità; inferenza)-Non è necessaria la conoscenza dell'intera popolazione
A SCELTA RAGIONATA
CAMPIONAMENTO
La scelta delle unità statistiche è affidata al ricercatore, ed è operata con obiettivi di rappresentatività di particolari aspetti della popolazione
PER QUOTE
- Si suddivide la pop. in gruppi omogenei, secondo una data caratteristica (come nel campionamento stratificato);
- Dentro ogni singolo gruppo si stabilisce il n° di caratteristiche da intervistare (quote);
- Il ricercatore sceglie, nei limiti delle quote, le unità da intervistare
A VALANGA
CAMPIONAMENTO
Molto utile per lo studio di popolazioni clandestine come immigrati irregolari, membri di sette religiose, evasori fiscali e tossicodipendenti;
Si individuano le unità statistiche a partire dalle informazioni che altri soggetti possono fornire;
Il campionamento parte da
Un piccolo numero di individui i quali oltre che come membri del campione, sono utilizzati per individuare altri soggetti appartenenti allo stesso gruppo;
Ogni volta che si intervista un individuo si raccolgono informazioni per contattare e raggiungere altri individui TRAMITE TESTIMONI PRIVILEGIATI;
CAMPIONAMENTO
Si ricorre a persone che, per la loro particolare attività, sono a conoscenza di particolari informazioni su specifici fenomeni;
Il loro coinvolgimento risulta indispensabile ai fini dello studio del fenomeno;
CAMPIONAMENTO
NON PROBABILISTICO PROBABILISTICO
PROBABILITÀ COSTANTE A SCELTA RAGIONATA PROBABILITÀ VARIABILI
Le unità statistiche della popolazione hanno tutte la stessa probabilità di essere estratte dal ricercatore o dal rilevatore;
Le unità della popolazione hanno probabilità diverse di essere estratte;
SEMPLICI CON RIPETIZIONI
PER QUOTE
Ogni unità una volta;
La popolazione è divisa in gruppi.
estratta viene reinserita
Dentro ogni gruppo si nella popolazione
scelgono le unità
rispettando una determinata quota
SEMPLICI SENZA RIPETIZIONI
Ogni unità una volta estratta non viene
A VALANGA reinserita nella
Le unità statistiche sono
individuate a partire dalle
informazioni fornite da
soggetti simili
STRATIFICATO
La pop. è divisa in strati
omogenei. Da ogni strato
si estrae un certo numero
TRAMITE TESTIMONI di unità
PRIVILEGIATI
Persone particolarmente
informate sul fenomeno
oggetto di studio
A GRAPPOLO
Si estrae un numero di
grappoli da una pop. e
tutte le unità del grappolo
entrano nel campione
SISTEMATICO
Le unità vengono estratte
scorrendo una lista e
selezionando una unità
ogni dato intervallo
A PIÙ STADI
Si fanno più estrazioni
consecutive. Ad ogni
estrazione si crea la base
per l'estrazione
successiva
ERRORI DI CAMPIONAMENTO ED ERRORI EXTRACAMPIONARI
STIMA: valore assunto da una grandezza che approssima il valore vero
Il testo formattato con i tag HTML sarebbe il seguente:(riferito alla popolazione) che non è dato conoscere. È sempre affetta di errore di campionamento o errore campionario
ERRORE DI CAMPIONAMENTO: differenza fra ciò che risulta dall'analisi del campione (stima) e il vero valore della popolazione che non è dato conoscere, cioè il parametro
Se il campione è probabilistico si può calcolare una stima dell'errore di campionamento, pur rimanendo nel parametro incognito, altrimenti se è non probabilistico no
ERRORI NON CAMPIONARI: tutti gli errori che si possono fare durante un'indagine, si manifestano anche nelle realizzazioni e, sono determinati dal fatto che nella pratica c'è sempre uno scostamento fra ciò che è una previsione nella progettazione dell'indagine e ciò che viene effettivamente fatto
DISTRIBUZIONI CAMPIONARIE E MEDIA CAMPIONARIA
STATISTICA CAMPIONARIA: dato un campione casuale di osservazioni X , X ,... , X
essa è una funzione delle osservazioni campionarie1 2 n t( )X , X ,... , X1 2 n
STATISTICA MEDIA CAMPIONARIA: se t = formula media aritmetica, allora:
- n1 ∑=X́ X in i=1
Dipende dall'osservazione campionaria t
DISTRIBUZIONE CAMPIONARIA DELLA STATISTICA: dato che una statistica assume valori diversi a seconda del valore estratto una statistica campionaria ha una sua distribuzione di probabilità, detta distribuzione campionaria della statistica
INFERENZA DA "ESPERIMENTO STATISTICO"
INFERENZA STATISTICA: volta ad affrontare il cosiddetto problema inverso in cui la struttura della popolazione è incognita e induttivamente si cerca di utilizzare un insieme limitato di informazioni derivanti da un campione casuale estratto dalla popolazione INFERENZA DA ESPERIMENTO STATISTICO DA POP. FINITE
Pop. virtuali, icui gli elementi sono generati dall'espstatistico La pop. è formata da un insieme finito E' stato pensato ed etichettabile per le scienze di
unità sperimentali in cui statistichele pop. possono essere ipotetiche e infinite Le pop. di interesse sociale ed economico, in generale, sono reali e finite Ambiti dell'inferenza STIMA DEI VERIFICAPARAMETR DI IPOTESI I STIMA PUNTUALE STIMA PERINTERVALLI STIMATORI E LE LORO PROPRIETA' PARAMETRO STIMA STIMATORE Incognito della pop. (o statistica campionaria) μ Media pop. Esempion1 Σ=X́ X in i=1 Media campionaria STIMATORE: variabile causale con la propria distribuzione campionaria θ PROPRIETA': 1. CORRETTEZZA corretto E(T) = θ distorto D(T) = E(T) - θ 2. EFFFICIENZA errore di stima T -errore quadratico medio MSE(T) = E[2](T -θ) T T più efficiente di se e solo se 1 2 ¿ ¿ T T MSE( < MSE(1 2 | | ∀ ϵ> ∀-θ <ϵ)=10: lim P( T θ 3. CONSISTENZA se nn→ ∞ STIMA PUNTUALE: quando un parametro della pop. È stato stimato con valore singolo MEDIA CAMPIONARIA = STIMATORE PUNTUALE
DELLA MEDIA DELLA μ (μ) POPOLAZIONE (μ) = μ STIMATORE CORRETTO PERCHÉ È X̄ PROPORZIONE CAMPIONARIA = STIMATORE PUNTUALE DELLA PROPORZIONE (x̄)(π) x + ¿ +...+n x x2 n (x̄) = π È STIMATORE CORRETTO PERCHÉ È Enx̄ = ¿ VARIANZA CAMPIONARIA CORRETTA VARIANZA CAMPIONARIA ≠ n n1 1∑ ∑Var(x) =2 2 2= ( - ) ( -x̄)S x x̄ xi in-1 ni=1 i=1
STIMA PER INTERVALLO: si stimano 2 estremi entro i quali tutti i valori sono possibili stime del parametro, secondo un certo grado di possibilità
INTERVALLO DI CONFIDENZA: intervallo di valori – determinato sulla base di un campione – che si ritiene contenere il vero parametro (incognito della popolazione)con un prefissato grado di fiducia<μ<q )=1-αP(q (prob. Che l’intervallo contenga il parametro incognito della1 2pop.)
USO DELLA TAVOLA DELLA