Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
STIMA PUNTUALE
È possibile [...] un campione rappresentativo della popolazione.
La statistica inferenziale viene [...] per ottenere informazioni sulla popolazione sulla base dei dati raccolti su un campione selezionato della stessa.
Una popolazione infinita è composta da tutte le possibili determinazioni osservabili e non necessariamente osservate.
- μ = E(X)
- σ2 = Var(X)
Tutte le variabili casuali (X1, X2, ..., Xm) sono identicamente distribuite, [...], con la medesima distribuzione di probabilità della popolazione X.
Il campione casuale è composto da m variabili casuali indipendenti e identicamente distribuite I.I.D.
L'errore campionario è sempre sconosciuto ma può essere contenuto utilizzando le proprietà degli stimatori.
La stima t è un numero! e una realizzazione delle v.c. T che rappresenta lo stimatore.
- t (X1, X2, ..., Xm) → T
- x1, x2, ..., xm → campione osservato
- X1, X2, ..., Xm → campione casuale
- t = t(x1, x2, ..., xm) → stima
- T = t(X1, X2, ..., Xm) → stimatore
Lo stimatore dipende dal campione e possiede una distribuzione campionaria.
Per stimare la media μ ignota si utilizza la media campionaria.
Stima X̅ = m ∑_(i=1)^m xi= E(X̅) = μ, per qualunque distribuzione
Var(X̅) = σ2(X̅)/m
Se la popolazione è Bernoulliana (solo valori 1 succ., e valori 0 insucc.)
i=1
n
= proporzione campionaria (frequenza rel.)
= π(1-π)
La distribuzione esatta della proporzione campionaria
è direttamente proporzionale alla VC binomiale
binomiale (n, π)
Le proprietà statistiche delle stimatori servono a
controllare l'uso campionario e, in generale il
concetto di affidabilità, accuratezza e precisione.
→ puntò → consideriamo nal l
per ε T. limite centrale, qualunque sia la
popolazione X la media campionaria assume
un P. aspetto normale con una V.C. NORMALE a.
Correttezza,
una stimatore b è corretto se (T) = θ
Bias = (T) - θ - disillusione
Efficienza → uso errore quadratico medio (MSE)
HSE(T) = Var(T) + Β(T)2
Var(T) = [(T - (T))2]
Ta + ege Ta se
T1 e più efficiente di T2 se HSE(T1) HSE(T2)
e uno stimatore è corretto → MSE(T) = Var(T)
T1 è più efficiente di T2 se Var(T1) Var(T2)
UN TEST STATISTICO O TEST D'IPOTESI è UNA
1) TEST
TEST STATISTICA CAMPIONARIA
 
- REGIONE DI ACCETTAZIONE
- REGIONE DI RIFIUTO
- α = probabilità di commettere errore di tipo I
- β = probabilità di commettere errore di tipo II
 
1-β = potenza del test = rifiuto H0/inversaprobabilità di rifiutare H0 quando è falsa
H0 / vera 
- Tipo I: rifiuto H0 quando H0 è vero
- Tipo II: accetto H0 quando H1 è vero
- = rifiuto H1 quando H0 è vera
 
1-α→βprob. detta (1-α)prob. b (α)→ z
→ zona di rifiutoè = z1-α/2⟶⟶ zona di rifiuto
C1 ←C2← 
E(T) = θ, stimatore corretto
Correttezza
Uno stimatore T è uno stimatore corretto di θ se E(T) = θ per tutti i possibili valori di θ (in caso contrario lo stimatore è distorto).La distorsione di uno stimatore è uguale a: B(T) = E(T) - θ
Si può omettere valori neg
potrei preferire uno stimatore distorto ma con varianza più piccola
se E(T) = θ → MSE(T) = Var(T)
Efficienza
Per valutare la prossimità di T al generico parametro θ (precisione) possiamo usare l'errore quadratico medio (mean square error MSE) dato da
MSE(T) = E[(T - θ)2] = Var(T) + B(T)2 dove Var(T) = E[(T - E(T))2]: è la varianza dello stimatore.Lo stimatore T1 è più efficiente di T2 se per tutti i valori del parametro θ si ha:
MSE(T1) MSE(T2)
MSE(T) = Var(T) + [E(T) - θ]2
E[(T-θ)2] - E(T) - θ
Se uno stimatore T è corretto (distorsione nulla) allora vale che per tutti i valori di θ
MSE(T) = Var(T) perciò si campione.Dato due stimatori corretti T1 e T2, si dirà che T1 è più efficiente di T2 se var(T1) < var(T2).
Ho più di uno stimatore per ogni parametro incognito poi fa confronto e scelgo
Efficienza
Nella figura sono riportate le distribuzioni campionarie di due stimatori corretti. Lo stimatore T1 possiede un errore quadratico medio (uguale alla varianza in questo caso) più piccolo di quello dello stimatore T2 (linea nera). Pertanto T1 è più efficiente.
STATISTICA 3
alpha = 0.05
-
Stimare IC per media e varianza del carattere PESO (comando normfit) α = 5%.
-
Stimare l'intervallo Z: confidenza del parametro p_i - q_zero per le coortiore fumatore x = 1.
- alpha = 0.01
- m = sum(Hospital, Smoker)
- N = length(Hospital, Smoker)
- [p_i_hat, p_ic_z] = binofit(m, N, alpha)
-
Effettuare un test d'ipotesi su carattere peso ipotizzando che sulla popolazione il peso medio sia 155 contro l'ipotesi alternativa che sia maggiore α = 0.01, p-value?
- [~, pv] = ttest(Hospital.Weight, 155, 'Alpha', 0.01, 'tail', 'right')
PV = 0.04 ➔ molla di nulla ➔ accetto H0
Se forma = 'tail' "left"
Se forma ≠ 'both'
Se H = 0 ➔ accetto ipotesi nulla (H0)
Se H = 1 ➔ rifiuto ipotesi nulla (accetto HA, alternativa)
Intervallo di confidenza per la varianza
Sia X una v.c che rappresenta un carattere osservato su una popolazione. Supponiamo che la v.c sia distribuita come una Normale con media e varianza ignota N. Come stimatori puntuali dei due parametri si possono utilizzare la media campionaria e la varianza campionaria corretta. Si ricordi che
Inoltre per la variabile casuale Chi quadro vale che
P(χ2n-1 ≤ X21) = α/2
e
P(X22 ≤ χ2n-1) = 1 - α/2
NB. la distribuzione non è simmetrica.
Con i seguenti passaggi:
- P(χ2α/2 ≤ X21 ≤ χ21-α) = 1 -α
- P(χ2α/2 ≤ (n-1)S2/σ2 ≤ χ21-α) =1 -α
- P([(n-1)S2]/χ21-α ≤ σ2 ≤ [(n-1)S2]/χ2α/2) =1 -α
si ottiene l'intervallo di confidenza (casuale) a livello 1 -α per la varianza
[((n-1)S2)/χ21-α/2, ((n-1)S2)/χ2α/2)]