Appunti Statistica III

Appunti per l'esame di statistica sui seguenti argomenti trattati: -Variabili casuali -Variabili casuali discrete-Variabili casuali continue-Campione-Intervalli di confidenzaAppunti per l'esame …

Esame Statistica

Facoltà Economia

Dal corso del Prof. Cannas Massimo

Università Università degli Studi di Cagliari

Publisher eleonora.ma00

A.A. 2019-2020

99 pagine

Appunto

Vota

Scarica

Estratto del documento

CAMPIONARIE

Se da una popolazione vengono estratti dei campioni di N osservazioni casuali, allora man mano che il numero aumenta la media delle medie campionarie tende alla PROBABILITÀ vera media della popolazione.

TALI DI MEDIE

Campione Campione Media campionaria Media campionaria Media tra i due valori del campione La distribuzione delle varie medie è detta distribuzione campionaria.

Distribuzione della media campionaria relativa il campionamento della popolazione di dipendenti (n=2). Da questa distribuzione si può ricavare il valore atteso che coincide con la media della popolazione.

Varianza variate n Ci dice quanto bene il valore della media campionaria approssimi il valore della media della popolazione. Più grande è il campione, tanto più il grado di incertezza che sto stimando tende a diminuire. Lo scarto quadratico medio è chiamato standard erro ed è dato da Iix. rn.

Consideriamo il caso in cui la popolazione da cui viene estratto il campione.

siadistribuita normalmenteIn ⁽¹⁾ ;Se la standardizziamoI ^{M[ ( )- N 0,1} = ÷Quando la media campionaria segueuna distribuzione normale possiamo ^)XctzPIÙstandardizzare la variable aleatoria < =I I.2. vi. µ-= ÈI :"unaSegue una distribuzione normale standard ¥Sia X la media campionaria di un campion e di nosservazione provenienti da una popolazione conmedia e varianza^1- La distribuzione di X ha media:^{EHI =p2}. La distribuzione di X ha deviazione standard : CAMPIONE PICCOLOAnche chiamato -0G- = standard error o SCELTO- RIPETIZIONECONpm errore standard di X3. Se l’ampiezza del campione non è sufficientemente piccola rispetto alladimensione della popolazione allora l’errore standards di X é:I N CAMPIONE GRANDEnof -= -M N 1 SENZA RIPETIZIONE--4. Se la distribuzione della popolazione è normale e quindi òadistribuzione di X è normale, allora la variable:=X[ tiÈ distribuita a normalmente con media 0 evarianza 1 Intervalli di accettazione In molte applicazioni è utile determinare l'INTERVALLO entro il quale cadono i valori delle medie campionarie. Un INTERVALLO DI ACCETTAZIONE è un intervallo entro il quale, se si conosce la media e la varianza della popolazione, ha ottime possibilità di rientrare la media campionaria. Es. Ipotizzando di conoscere media e varianza della popolazione possiamo costruire un INTERVALLO DI ACCETTAZIONE SIMMETRICO. Proporzione campionaria Sia X il numero di successi in un campione n di osservazioni estratte da una popolazione BERNOULLIANA con parametro p. Il parametro p rappresenta la proporzione delle unità della popolazione che possiedono le caratteristiche oggetto di studio. Si definisce PROPORZIONE CAMPIONARIA il rapporto. La media e la varianza della proporzione campionaria può essere ottenuto dalla media e la varianza del numero di successi. La media della distribuzione di proporzione coincide con la media della popolazione. Distribuzione dellaproporzione campionaria Sia P la distribuzione campionaria di successi in un campione causale estratto da una popolazione con proporzione di successi p1. La proporzione campionaria P ha media p̂ = p2. La proporzione campionaria P ha divisione standard (o standard error) σ̂p = √(p1(1-p1)/n). Se il campione ha un'ampiezza elevata, la variabile aleatoria è approssimativamente distribuita come una normale standard. L'approssimazione è buona se: |p1 - p2| > 2√(p1(1-p1)/n). Varianza campionaria Sia dato un campione grande di n osservazioni. La quantità s^2 è detta varianza campionaria e si calcola come: s^2 = Σ(Xi - p̂)^2 / (n-1). Si dimostra essere non distorta. Si dimostra che si distribuisce come la variabile casuale chi quadro. Quindi: (s^2 / σ^2) ~ χ^2(n-1). Quello che sto cercando, quindi non distorto, è il valore atteso di s^2, che è (n-1)σ^2.

libertà) Quando non è nota bisogna stimare ricorrendo a x. Utilizzando la media campionaria e non quella della popolazione si perde un grado di libertà.

Distribuzione della varianza campionaria: Si indichi con S la varianza campionaria di un campione di n osservazioni provenienti da una popolazione con varianza σ^2. La distribuzione della varianza campionaria S ha media σ^2 e varianza 2σ^4/(n-1). La varianza della distribuzione di S dipende dalla distribuzione della popolazione. Se questa è distribuita normalmente, allora S è distribuita come una X^2 con n-1 gradi di libertà.

Disponendo di un campione casuale estratto da una popolazione distribuita normalmente, si può fare inferenza sulla varianza della popolazione σ^2 utilizzando S e la distribuzione X^2.

Distribuzione media campionaria: Se non conosco σ^2, posso usare lo stimatore della media campionaria x. La varianza campionaria S^2 è un'incognita.

SE σ^2 ≠ 0, allora VARI(x̄) = σ^2/n. Non potrei usare lo stimatore della media campionaria x̄ se σ^2 = 0.

INCOGNITA " drn POSSIAMO SOSTITUIRE? ?A 50 V.LA C.'E UNO STIMATORE?DI 0 NON DISTORTO

Non posso più chiamarlo Z ma TI1- µ-= ten )1~ -Shin Segue una legget con n-1 gradidi libertà

Se conosco → uso Z2g- → uso T (T di Student )

Se non la conosco

Differenza tra medie

Carattere x osservato su 2popolazioni e voglio vedere se c'è differenza fa le due medie

La normale:

XNNlmn.sn ? IXnNlmz,rilxT-s

Consideriamo 2 campioni di ampiezza n e n2 estratti da 2 popolazioni

Avrò due medie campionarie

Media campionaria del 1 campione tra Media campionaria del 2 campione

FI ?tannini ) (INN )mai, II-IIINlnn )Erin( In ma-- ,In( Ia () 'mi- N'-z 2-= Neon )~?I 02+nn ha

È lo stimatore della differenza tra medie

022SE ?NON ABBIAMO 01 E

Ma sono supposte uguali

Abbiamo:

Possiamo costruire una stima congiunta della varianza

si? (1) 1)51sprechi na+ -- ha + ha 2- ↳ un -1-1 ha+ == ha + 2ha -ha NUMEROSITA→ 'DEL 1 ' CAMPIONEhz NUMEROSITA→

DEL '2 CAMPIONEÈ una media ponderata delle 2 varianzestimate In( Ia )1- (= Mal- ma -- tlnrtna )-2~( fa faSP )+ T STUDENT-CON hithz -2GRADI DI LIBERTA 'Intervalli di confidenzaSupponiamo di estrarre un campionecasuale da una popolazione con- Media incognita-Varianza notaIl nostro obiettivo è quello ditrovare un intervallo di valori perstimare la media della popolazioneQuando l ampiezza del campione èabbastanza grande il procedimentousato per stimare la media può esserefatto anche se bisogna STIMARE LAVARIANZA attraverso il campioneCampioni più grandi determinatostime per intervallo più preciseSupponiamo di estrarre E di trovare variripetutamente dei intervalli da A a Bcampioni casuali Chiamati intervalli di confidenzaAll interno del quale puòesserci o meno il parametroAlla fine il 95% di intervalli estratti conterrà il verovalore del parametro incognitoIndividuare due valori che delimitanol'INTERVALLO per il

parametro incognito della popolazione

Io sono interessata a 0 e cerco dei valori

tra i quali possa essere compreso

Come si fa? Determina gli estremi di un

intervallo di valori che

verosimilmente contiene il

parametro da stimare

La stima corrispondente viene

chiamata stima per intervallo

Livello di confidenza

o livello fiduciario Che noi associamo al

risultato ottenuto

Quando diremo confido che il valore Sì estrae ripetutamente un numero

vero della popolazione sia compreso tra molto elevato di campioni

questi due valori che sto indicando,

confido che questo accada con un livello

di probabilità 1-

Caso più semplice

Supponiamo di avere un campione casuale di

n osservazioni estratto da una popolazione

normale con media incognita e varianza nota

È possibile standardizzarla

Sappiamo che la standard della media

campionaria ci da una normale 0,1

Se consideriamo le tavole della Z possiamo

individuare due valori c1 e c2 tale che

La probabilità che zeta sia tra

questi due valori

È proprio 1-alfa, l'area dell'intervallo è 1-alfa. Quante sono le coppie di c1 e c2 tali che l'intervallo abbia come area 1-alfa? Ma se imponiamo il vincolo che c1 e c2 siano centrali, imponiamo che la quantità a sinistra di c1 sia alfa/2 e la quantità a destra di c2 sia alfa/2, allora si ha solo c1 e c2. La probabilità che la media sia compresa in questo intervallo è pari a 1 - alfa. Questa formula vale prima dell'estrazione, non abbiamo ancora dati per quello questo intervallo viene definito ancora INTERVALLO CASUALE. Tale intervallo comprende il valore incognito con probabilità 1-alfa, indipendentemente dal valore di X. Infatti non è presente. Se sostituiamo X a x calcolato sul campione, quindi estratto, abbiamo l'intervallo di confidenza. Caso 1: INTERVALLO PER LA MEDIA (Visto prima) CONOSCENDO LA VARIANZA Possiamo ottenere i limiti dell'intervallo di confidenza con: Caso 2: INTERVALLO PER LA MEDIA

NONCONOSCENDO LA VARIANZA

Nel caso in cui la deviazione standard fosse incognita non si può utilizzare la normale distribuzione T-Student

Anteprima

Vedrai una selezione di 16 pagine su 99