Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
D ISTRIBUZIONE CAMPIONARIA DELLA PROPORZIONE
Sia la popolazione distribuita come una bernoulliana con parametri 1, p
Le condizioni sottostante a questi:
- Popolazione infinite
- Popolazione finite schema di estrazione con replicazione
- Campione casuale IID
Quando si lavora con una popolazione dicotomica un possibile campione casuale è una successione di 0 e 1.
Ad esempio, un campione osservato di dimensione n=6, potrebbe essere
: 0,1,0,0,0,1
La media campionaria
̅= ̂
∑ =
=
Applicata ad una successione di 0 e 1, indica il numero di “successi” diviso il totale delle osservazioni (n) cioè,
definisce la proporzione di successi sul campione. Per enfatizzare questo aspetto, la media campionaria viene
spesso indicata con 0 ≤ ̂ ≤ 1
Dove il cappello indica che è di natura campionaria e p sta ad indicare la popolazione su n numeri di successi
Indichiamo con
= ∑
=1
numero di “successi” su n prove indipendenti (quanti “uno” ci sono nel campione)
Il
Allora possiamo scrivere:
Sia X il numero dei successi in un campione di n osservazioni estratte da una popolazione bernoulliana con
parametro p. Il parametro rappresenta la proporzione delle unità della popolazione che possiedono le
caratteristiche oggetto di studio. si definisce proporzione campionaria il rapporto:
̂=
Dove x è la variabile casuale binomiale ed n la dimensione del campione
M EDIA E VARIANZA DELLA MEDIA CAMPIONARIA PER UNA POPOLAZIONE BERNOULLIA NA
Abbiamo detto che la proporzione campionaria è una media campionaria quando si campiona da una Bernoulli.
Si ricorda che: ̅) ̂)
( = ⟶ ( =
)
(̂ È la media della popolazione ossia la media delle variabili di Bernoulli
( − )
̅) ̂)
( = ⟶ ( =
)
(̂ è la varianza della popolazione bernoulliana fratto n
All’aumentare di n la variabile di ̂ tende a 0 e quindi la proporzione campionaria tende ad essere più
concentrata intorno alla media della popolazione all’aumentare dell’ampiezza
Esempio
Pertanto, ̂
= ~(, )
n volte la proporzione campionaria è una variabile casuale binomiale
e (̂ ≤ ) = (̂ ≤ )
Si ha
̂=
~(, )
(1 − ) > 9
Se la proporzione campionaria può essere approssimata da una variabile casuale normale
̂
Si passa da a Z usando la formula ̂− ̂−
= =
√( − )
̂
La stima parametrica
Da un problema del mondo reale si vuole studiare un certo dato e abbiamo la popolazione che ci dà le
informazioni. Ci si costruisce un modello (normale o bernoulliano) che deve descrivere completamente la
popolazione e attraverso una deduzione (ossia una probabilità): nel percorso in verde la distribuzione
campionaria ci identifica la probabilità.
Il percorso in rosso identifica che dalla popolazione si estrae un CCS e si affrontano due problemi:
- Problemi di stima
- Test delle ipotesi
La stima è formata da due argomenti:
- Problema della stima puntuale ossia si estrae un CCS con n osservazioni che daranno informazioni
sul parametro incognito attraverso una sintesi e si stima un numero che sarà una stima del parametro
incognito
- Problema di stima per intervalli, che presumibilmente conterrà il parametro incognito
L O STIMATORE PUNTALE
La stima parametrica serve a effettuare una stima su un parametro incognito
Uno stimatore di un parametro della popolazione non è altro che una statistica ed è una (funzione di) variabile
casuale che dipende dalla informazione contenuta nel campione per produrre una stima il cui valore fornisce
un’approssimazione del valore sconosciuto del parametro.
Uno specifico valore della variabile aleatoria viene chiamato stima puntuale
Noi utilizzeremo il metodo analogico, per cui se voglio stimare analogicamente prendo la media
̅
campionaria e così via anche per la proporzione e la varianza l’attendibilità della stima
Il secondo problema è il valore che gli si attribuisce allo stimatore, ossia che
dipende dal comportamento dello stimatore nello spazio campionario. t è una buona stima se lo stimatore ha
i
delle buone proprietà
Un campione casuale semplice è un campione estratto da uno spazio campionario
Uno stimatore del tipo
= ∑
=
Che è una combinazione lineare di variabili casuali
1
=
Dove
È uno stimatore lineare (la media campionaria e la proporzione campionaria sono stimatori lineari)
La varianza invece non è uno stimatore lineare
P
ROPRIETÀ DESIDERABILE ̂
La non distorsione o correttezza: uno stimatore puntale viene definito stimatore non distorto per il
̂
parametro se il valore atteso, o media, della distribuzione campionaria di è , per cui
(̂) =
̅ (̅)
: =
La media campionaria è uno stimatore corretto per )
̂ (̂ =
La proporzione campionaria è uno stimatore corretto per p: 1 =1 ̅)
2 2 2
∑ (
= −
La varianza campionaria è uno stimatore corretto per :
−1
(Si divide per n-1 perché il suo valore atteso coincide con la varianza della popolazione)
➔ Producono stimatori vicini al parametro incognito
Dimostrazione della correttezza dello stimatore lineare
=
)
() = ∑ (
= ∑ ()
= ∑
1
∑ ∑
() = = 1 = 1
Pertanto, se cioè
stimatore è lineare se la somma dei coefficienti ossia i “pesi” è=1
Uno
Si possono scegliere i “pesi” ossia i coefficienti affinché sia uno stimatore corretto in infiniti modi. Posso
costruire infiniti stimatori corretti per la media della popolazione.
̂ ̂
,
Distorsione: sia uno stimatore per la distorsione di è definita come la differenza tra la sua media e
̂ ̂)
( = ( −
)
La distorsione di uno stimatore non distorto è 0
̂ ̂
,
Correttezza asintotica: sia uno stimatore per è uno stimatore asintoticamente corretto per se la
̂ diminuisce al crescere dell’ampiezza del campione:
differenza tra il valore atteso e ̂
( )=
→∞
La correttezza asintotica è desiderata quando non si possono ottenere stimatori non distorti. Tutti gli stimatori
non distorti sono asintoticamente distorti, mentre non tutti gli stimatori asintoticamente non distorti sono
non distorti. diversi stimatori non distorti per θ. Lo stimatore più efficiente
Stimatore più efficiente: Supponiamo esistano
o stimatore non distorto con varianza minima per θ è lo stimatore non distorto con la varianza più piccola
̂ ̂ stimatori non distorti per θ, basati sullo stesso numero di
Siano e due osservazioni campionarie. Allora,
1 2
̂ ̂ ̂ ̂
( < (
) )
- è più efficiente di se
1 2
̂ ̂
L’efficienza relativa di
- rispetto a è il rapporto tra le loro varianze
1 2 ̂
( )
= ̂
( )
Si dimostra che la media campionaria è lo stimatore BLU della media della popolazione. Tra gli stimatori
lineari e corretti della media della popolazione la media campionaria è lo stimatore più efficiente
B=Best
L=Linear
U=Unbiased
Esempio:
I
NTERVALLI DI CONFIDENZA
Uno stimatore per intervallo per un parametro di una popolazione è una funzione delle variabili campionarie;
determina gli estremi di un intervallo di valori che verosimilmente contiene il parametro da stimare. La
stima corrispondente viene chiamata stima per intervallo
Rispetto ad una stima puntuale, una stima per intervallo fornisce maggiori informazioni sulla caratteristica
della popolazione oggetto di studio. Tali stime per intervallo sono chiamate intervalli di confidenza
( , . . . , ) ( , . . . , )
Siano e due statistiche campionarie tali che:
1 1, 2 2 1, 2
( , . . . , ) ≤ ( , . . . , )
1. per ogni possibile campione
, ,
[ ( , . . . , ) ≤ ≤ ( , . . . , ) = − 0 ≤ ≤ 1
]
2. con ossia che la probabilità
, ,
dell’intervallo T1 e T2 contenga teta sia uguale a 1-alfa
Allora, l’intervallo [ ( , . . . , ) ( , . . . , )]
, viene detto INTERVALLO CASUALE, cioè
, ,
variano al variare del campione che tale intervallo contenga il parametro incognito θ
100(1 − )%
La (2.) fornisce la probabilità pari a
( , . . . , ) = ( , . . . , ) = ( , . . . , )
Se e sono i valori osservati di e
1 1, 2 1 2 1, 2 2 1 1, 2
( , . . . , ) ( , . . . , ),
in corrispondenza di uno specifico campione osservato, allora
2 1, 2 1, 2
L’intervallo [ , ( − )%,
1. ] viene definito intervallo di confidenza a livello cioè al 95% ad
1 2
per il parametro θ
esempio, dell’intervallo (α compreso tra 0 e 1)
(1 − )
2. La quantità viene definita livello di confidenza dell’intervallo
, sono chiamati, rispettivamente, Limite Inferiore e Limite Superiore di confidenza.
è la lunghezza o ampiezza dell’intervallo
= −
La quantità di confidenza.
1 2
INTERPRETAZIONE: Se si estraggono ripetutamente campioni dalla popolazione, il vero valore del
parametro θ sarà contenuto nel ( − )% degli intervalli
Se dentro c’è il 95% delle palline
determin