Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
CAMPIONARIE
Se da una popolazione vengono estratti dei campioni di N osservazioni casuali, allora man mano che il numero aumenta la media delle medie campionarie tende alla PROBABILITÀ vera media della popolazione.
TALI DI MEDIE
Campione Campione Media campionaria Media campionaria Media tra i due valori del campione La distribuzione delle varie medie è detta distribuzione campionaria.
Distribuzione della media campionaria relativa il campionamento della popolazione di dipendenti (n=2). Da questa distribuzione si può ricavare il valore atteso che coincide con la media della popolazione.
Varianza variate n Ci dice quanto bene il valore della media campionaria approssimi il valore della media della popolazione. Più grande è il campione, tanto più il grado di incertezza che sto stimando tende a diminuire. Lo scarto quadratico medio è chiamato standard erro ed è dato da Iix. rn.
Consideriamo il caso in cui la popolazione da cui viene estratto il campione.
siadistribuita normalmenteIn (1) ;Se la standardizziamoI M[ ( )- N 0,1 = ÷Quando la media campionaria segueuna distribuzione normale possiamo )XctzPIÙstandardizzare la variable aleatoria < =I I.2. vi. µ-= ÈI :"unaSegue una distribuzione normale standard ¥Sia X la media campionaria di un campion e di nosservazione provenienti da una popolazione conmedia e varianza1- La distribuzione di X ha media:EHI =p2. La distribuzione di X ha deviazione standard : CAMPIONE PICCOLOAnche chiamato -0G- = standard error o SCELTO- RIPETIZIONECONpm errore standard di X3. Se l’ampiezza del campione non è sufficientemente piccola rispetto alladimensione della popolazione allora l’errore standards di X é:I N CAMPIONE GRANDEnof -= -M N 1 SENZA RIPETIZIONE--4. Se la distribuzione della popolazione è normale e quindi òadistribuzione di X è normale, allora la variable:=X[ tiÈ distribuita a normalmente con media 0 evarianza 1 Intervalli di accettazione In molte applicazioni è utile determinare l'INTERVALLO entro il quale cadono i valori delle medie campionarie. Un INTERVALLO DI ACCETTAZIONE è un intervallo entro il quale, se si conosce la media e la varianza della popolazione, ha ottime possibilità di rientrare la media campionaria. Es. Ipotizzando di conoscere media e varianza della popolazione possiamo costruire un INTERVALLO DI ACCETTAZIONE SIMMETRICO. Proporzione campionaria Sia X il numero di successi in un campione n di osservazioni estratte da una popolazione BERNOULLIANA con parametro p. Il parametro p rappresenta la proporzione delle unità della popolazione che possiedono le caratteristiche oggetto di studio. Si definisce PROPORZIONE CAMPIONARIA il rapporto. La media e la varianza della proporzione campionaria può essere ottenuto dalla media e la varianza del numero di successi. La media della distribuzione di proporzione coincide con la media della popolazione. Distribuzione dellaproporzione campionaria Sia P la distribuzione campionaria di successi in un campione causale estratto da una popolazione con proporzione di successi p1. La proporzione campionaria P ha media p̂ = p2. La proporzione campionaria P ha divisione standard (o standard error) σ̂p = √(p1(1-p1)/n). Se il campione ha un'ampiezza elevata, la variabile aleatoria è approssimativamente distribuita come una normale standard. L'approssimazione è buona se: |p1 - p2| > 2√(p1(1-p1)/n). Varianza campionaria Sia dato un campione grande di n osservazioni. La quantità s^2 è detta varianza campionaria e si calcola come: s^2 = Σ(Xi - p̂)^2 / (n-1). Si dimostra essere non distorta. Si dimostra che si distribuisce come la variabile casuale chi quadro. Quindi: (s^2 / σ^2) ~ χ^2(n-1). Quello che sto cercando, quindi non distorto, è il valore atteso di s^2, che è (n-1)σ^2.libertà) Quando non è nota bisogna stimare ricorrendo a x. Utilizzando la media campionaria e non quella della popolazione si perde un grado di libertà.
Distribuzione della varianza campionaria: Si indichi con S la varianza campionaria di un campione di n osservazioni provenienti da una popolazione con varianza σ^2. La distribuzione della varianza campionaria S ha media σ^2 e varianza 2σ^4/(n-1). La varianza della distribuzione di S dipende dalla distribuzione della popolazione. Se questa è distribuita normalmente, allora S è distribuita come una X^2 con n-1 gradi di libertà.
Disponendo di un campione casuale estratto da una popolazione distribuita normalmente, si può fare inferenza sulla varianza della popolazione σ^2 utilizzando S e la distribuzione X^2.
Distribuzione media campionaria: Se non conosco σ^2, posso usare lo stimatore della media campionaria x. La varianza campionaria S^2 è un'incognita.
SE σ^2 ≠ 0, allora VARI(x̄) = σ^2/n. Non potrei usare lo stimatore della media campionaria x̄ se σ^2 = 0.
INCOGNITA " drn POSSIAMO SOSTITUIRE? ?A 50 V.LA C.'E UNO STIMATORE?DI 0 NON DISTORTO
Non posso più chiamarlo Z ma TI1- µ-= ten )1~ -Shin Segue una legget con n-1 gradidi libertà
Se conosco → uso Z2g- → uso T (T di Student )
Se non la conosco
Differenza tra medie
Carattere x osservato su 2popolazioni e voglio vedere se c'è differenza fa le due medie
La normale:
XNNlmn.sn ? IXnNlmz,rilxT-s
Consideriamo 2 campioni di ampiezza n e n2 estratti da 2 popolazioni
Avrò due medie campionarie
Media campionaria del 1 campione tra Media campionaria del 2 campione
FI ?tannini ) (INN )mai, II-IIINlnn )Erin( In ma-- ,In( Ia () 'mi- N'-z 2-= Neon )~?I 02+nn ha
È lo stimatore della differenza tra medie
022SE ?NON ABBIAMO 01 E
Ma sono supposte uguali
Abbiamo:
Possiamo costruire una stima congiunta della varianza
si? (1) 1)51sprechi na+ -- ha + ha 2- ↳ un -1-1 ha+ == ha + 2ha -ha NUMEROSITA→ 'DEL 1 ' CAMPIONEhz NUMEROSITA→
DEL '2 CAMPIONEÈ una media ponderata delle 2 varianzestimate In( Ia )1- (= Mal- ma -- tlnrtna )-2~( fa faSP )+ T STUDENT-CON hithz -2GRADI DI LIBERTA 'Intervalli di confidenzaSupponiamo di estrarre un campionecasuale da una popolazione con- Media incognita-Varianza notaIl nostro obiettivo è quello ditrovare un intervallo di valori perstimare la media della popolazioneQuando l ampiezza del campione èabbastanza grande il procedimentousato per stimare la media può esserefatto anche se bisogna STIMARE LAVARIANZA attraverso il campioneCampioni più grandi determinatostime per intervallo più preciseSupponiamo di estrarre E di trovare variripetutamente dei intervalli da A a Bcampioni casuali Chiamati intervalli di confidenzaAll interno del quale puòesserci o meno il parametroAlla fine il 95% di intervalli estratti conterrà il verovalore del parametro incognitoIndividuare due valori che delimitanol'INTERVALLO per ilparametro incognito della popolazione
Io sono interessata a 0 e cerco dei valori
tra i quali possa essere compreso
Come si fa? Determina gli estremi di un
intervallo di valori che
verosimilmente contiene il
parametro da stimare
La stima corrispondente viene
chiamata stima per intervallo
Livello di confidenza
o livello fiduciario Che noi associamo al
risultato ottenuto
Quando diremo confido che il valore Sì estrae ripetutamente un numero
vero della popolazione sia compreso tra molto elevato di campioni
questi due valori che sto indicando,
confido che questo accada con un livello
di probabilità 1-
Caso più semplice
Supponiamo di avere un campione casuale di
n osservazioni estratto da una popolazione
normale con media incognita e varianza nota
È possibile standardizzarla
Sappiamo che la standard della media
campionaria ci da una normale 0,1
Se consideriamo le tavole della Z possiamo
individuare due valori c1 e c2 tale che
La probabilità che zeta sia tra
questi due valori
È proprio 1-alfa, l'area dell'intervallo è 1-alfa. Quante sono le coppie di c1 e c2 tali che l'intervallo abbia come area 1-alfa? Ma se imponiamo il vincolo che c1 e c2 siano centrali, imponiamo che la quantità a sinistra di c1 sia alfa/2 e la quantità a destra di c2 sia alfa/2, allora si ha solo c1 e c2. La probabilità che la media sia compresa in questo intervallo è pari a 1 - alfa. Questa formula vale prima dell'estrazione, non abbiamo ancora dati per quello questo intervallo viene definito ancora INTERVALLO CASUALE. Tale intervallo comprende il valore incognito con probabilità 1-alfa, indipendentemente dal valore di X. Infatti non è presente. Se sostituiamo X a x calcolato sul campione, quindi estratto, abbiamo l'intervallo di confidenza. Caso 1: INTERVALLO PER LA MEDIA (Visto prima) CONOSCENDO LA VARIANZA Possiamo ottenere i limiti dell'intervallo di confidenza con: Caso 2: INTERVALLO PER LA MEDIANONCONOSCENDO LA VARIANZA
Nel caso in cui la deviazione standard fosse incognita non si può utilizzare la normale distribuzione T-Student