Anteprima
Vedrai una selezione di 4 pagine su 12
Statistica inferenziale  Pag. 1 Statistica inferenziale  Pag. 2
Anteprima di 4 pagg. su 12.
Scarica il documento per vederlo tutto.
Statistica inferenziale  Pag. 6
Anteprima di 4 pagg. su 12.
Scarica il documento per vederlo tutto.
Statistica inferenziale  Pag. 11
1 su 12
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

❑ MODELLI DI VARIABILI CASUALI CONTINUE:

~

1. UNIFORME: X uni (a, b) è caratterizzata da una distribuzione di probabilità che assegna la

stessa probabilità a tutte le possibili realizzazioni di x.

2. NORMALE:

X ~ N (media, sigma quadro) costituita da una forma campanulare, è simmetrica, media

moda e mediana coincidono.

La v.a normale approssima molto bene le distribuzioni di probabilità di un numero elevato di

variabili aleatorie. In presenza di campioni “grandi” la distribuzione della media campionaria

è approssimata dalla distribuzione normale.

La probabilità relativa all’intervallo sarà (P(a<X<b) = F(b) - F(a).

Qualunque distribuzione normale può essere trasformata nella DISTRIBUZIONE NORMALE

STANDARD Z: con media 0 e varianza 1. Z ~ N (0, 1) questo ci permette di trasformare i valori

di X in valori di Z, usare le tavole di ripartizione di Z per calcolare la probabilità Z= x- m/

sigma.

• La tavola della Normale standard fornisce valori della funzione di ripartizione della

distribuzione normale standard. Per un dato valore di Z, la tavola fornisce F(a). Per valori

negativi di Z si sfrutta la proprietà della simmetria della distribuzione per trovare la

probabilità desiderata. (1- Z)

• Approssimazione di una binomiale con la distribuzione normale: la forma della

distribuzione binomiale p approssimativamente normale se n è grande, si può approssimare

in una normale se nP(1-P) > 9

3. ESPONENZIALE:

usata per modellare l’ammontare di tempo che intercorre tra due eventi. La variabile T ha

funzione di densità di probabilità

dove lambda è il numero medio di occorrenze per intervallo di tempo e t rappresenta il

numero di unità di tempo sino alla prossima occorrenza.

4. CHI-QUADRO:

si distribuisce con una funzione di densità di probabilità con r gradi di libertà, dipende dal

parametro r.

I gradi di libertà sono il numero di osservazioni indipendenti del campione,

meno il k di parametri della popolazione che devono essere stimati per mezzo del

campione.

All'aumentare dei gradi di libertà r tende all’infinito la distribuzione chi-quadro tende

sempre alla simmetria della distribuzione normale. Quindi può essere standardizzata. La

funzione di densità è asimmetrica, con una lunga coda per valori positivi. La sua media e la

sua varianza sono rispettivamente uguali al numero di gradi di libertà e a due volte il numero

di gradi di libertà.

5. T DI STUDENT:

La distribuzione t di Student è il rapporto tra due distribuzioni: la distribuzione normale

standard e la radice quadrata della distribuzione chi-quadrato, divisa per i suoi gradi di

libertà r. La T- Student tende ad una normale già per r>30, infatti si ottiene valor medio nullo

e varianza 1.07.

CAMPIONAMENTO E STIMATORI

❑ IN GENERALE

− Facciamo inferenza sulla popolazione esaminando i risultati campionari, estrarre conclusioni

e/o prendere decisioni riguardanti una popolazione sulla base dei risultati campionari.

Tramite la stima e la verifica delle ipotesi.

− Con il termine distribuzione campionaria si fa riferimento alla distribuzione di tutti i possibili

valori di una statistica ottenuti da campioni della stessa ampiezza estratti dalla popolazione.

• Uno STIMATORE di un parametro della popolazione è:

Una variabile aleatoria che dipende dall’informazione contenuta in un campione, il cui valore

fornisce un’approssimazione su un parametro non noto. Uno specifico valore della variabile

aleatoria viene chiamato stima puntuale.

Per esempio, possiamo stimare il parametro della popolazione come la media, tramite una

statistica campionaria (stima puntuale) che è la media campionaria.

Le proprietà dello stimatore:

1. CORRETTEZZA:

dato uno stimatore puntuale T si dice non distorto se il suo valore atteso, è uguale al

parametro della popolazione θ. Es. La media campionaria è uno stimatore corretto della

media della popolazione.

La distorsione è misurata dalla differenza tra il valore atteso dello stimatore e il parametro

da stimare (distorsione di bias) è quindi D(T) = E(T) - . la distorsione di uno stimatore non

distorto, quindi, vale 0.

2. EFFICENZA:

supponiamo esistano diversi stimatori non distorti, lo stimatore più efficiente è lo stimatore

non distorto con varianza più piccola, aventi entrambi lo stesso numero di osservazioni

campionarie. lo stimatore più efficiente richiede un campione più piccolo.

L’efficienza relativa di uno stimatore rispetto a un altro è il rapporto tra le loro varianze.

3. CONSISTENZA:

Tn è uno stimatore consistente θ (parametro della popolazione) se la differenza del valore

atteso di Tn e di diminuisce al crescere dell’ampiezza del campione.

❖ TEOREMA DEL LIMITE CENTRALE

Al crescere della dimensione del campione la distribuzione campionaria diventa quasi

normale indipendentemente dalla distribuzione della popolazione, possiamo applicare il

teorema del limite centrale anche se la popolazione non è normale, la media campionaria

sarà approssimativamente normale purché l’ampiezza del campione sia abbastanza grande.

❑ DISTRIBUZIONE MEDIA CAMPIONARIA:

1. CASO 1: VARIANZA NOTA DELLA POPOLAZIONE

La media campionaria è definita come:

Mentre la variabilità nel valore della media del campione è data dall’errore standard

(diminuisce all’aumentare del campione):

Se la popolazione è normale con media e scarto quadratico medio, allora Z per la

distribuzione media campionaria è:

2. CASO 2: VARIANZA NON NOTA

Non conosco la varianza, non posso standardizzare, stimare la varianza della popolazione

2

non nota con la varianza campionaria S

sì, distribuisce come chi quadro con n-1 gradi di libertà.

❑ DISTIBUZIONE DELLA PROPORZIONE CAMPIONARIA

La proporzione campionaria è il numero di unità del campione fratto la dimensione del

campione: Sn/n, è un numero compreso tra 0 e 1. può essere approssimata da una

distribuzione normale quando np(1-p)>9.

Standardizzando abbiamo:

❑ DISTRIBUZIONE DELLA VARIANZA CAMPIONARIA

Si definisce varianza campionaria la quantità: 2

Dividendo per n-1 viene corretta la piccola distorsione e perciò S è uno stimatore non

distorto. Abbiamo corretto i gradi di libertà. Quindi la varianza campionaria è una variabile

aleatoria distribuita con chi quadro con n-1 gradi di libertà:

❑ DISTRIBUZIONE DELLA DIFFERENZA TRA MEDIE

DUE CASI:

2 2

σx e σy Note:

1. campioni aleatori e indipendenti, entrambe le popolazioni hanno distribuzione normale,

varianze note.

2 2

2. σx e σy Non note, ma uguali:

stimare la varianza campionaria delle due variabili. Stimo Sx con ampiezza nx e stimo Sy con

ampiezza ny. Stimare poi la varianza ponderata:

INTERVALLI DI CONFIDENZA

Rispetto a una stima puntuale la stima per intervallo fornisce maggiori informazioni sulla

caratteristica della popolazione oggetto di studio. Le stime per intervallo sono chiamate intervalli di

confidenza. Un intervallo fornisce una serie di valori:

− È basato sulle osservazioni di un campione

− Fornisce informazioni sulla vicinanza allo sconosciuto parametro della popolazione

− Espresso in termini di livello di confidenza

Se P (A< θ < B) = 1- α.

La quantità 1- α viene definita livello di confidenza dell’intervallo. (α compreso tra 0 e 1)

La formula generare per tutti gli intervalli di confidenza è:

STIMA PUNTUALE ± FATTORE DI AFFIDABILITA’ × ERRORE STANDARD

L'obbiettivo è quello di determinare un intervallo entro il quale verosimilmente cadono i valori delle

medie campionarie per una data media e varianza della popolazione.

Sia Z α/2 il valore della Z che lascia nella coda destra della distribuzione normale standard l’area α/2"

(ossia, l'intervallo che va da - Zα/2 a +Z α/2 racchiude. Probabilità 1- α) allora

È l’intervallo che include X probabilità 1- α.

I livelli di confidenza più usati sono 95% 90% e 99%.

1. INTERVALLO DI CONFIDENZA PER LA MEDIA

− VARIANZA NOTA: popolazione ha distribuzione normale, con campioni grandi

Intervallo di confidenza:

− VARIANZA NON NOTA: sostituiamo la varianza della popolazione con la varianza campionaria

2

S questo introduce ulteriore incertezza siccome S varia da campione a campione, quindi

usiamo la v.a T di Student invece della variabile normale.

Intervallo di confidenza:

2. INTERVALLO DI CONFIDENZA PER LA PROPORZIONE

Ricordiamo che se il campione è grande, la distribuzione della proporzione campionaria è

approssimativamente normale.

Intervallo di confidenza:

3. INTERVALLO DI CONFIDENZA PER LA VARIANZA

Utilizziamo la distribuzione chi quadro.

Calcoliamo la varianza campionaria, l’intervallo di confidenza è:

→ MARGINE DI ERRORE

È possibile calcolare l’ampiezza campionaria (n) necessaria per garantire un desiderato

margine di errore (ME), con uno specificato livello di confidenza.

Il margine di errore e anche chiamato errore di campionamento, ed è l’ammontare di

imprecisione nella stima del parametro della popolazione e l’ammontare aggiunto e

sottratto dalla stima puntuale per formare l’intervallo di confidenza.

• PER LA MEDIA: ampiezza campionaria

• PER LA PROPORZIONE: ampiezza campionaria 2

SE VOGLIAMO DETERMINARE L’AMPIEZZA DELL’INTERVALLO INVECE: W= 2 ME

4. INTERVALLO DI CONFIDENZA PER LA DIFFERENZA TRA MEDIE

− CAMPIONI DIPENDENTI: stima della differenza tra le medie di due popolazioni dipendenti,

Campioni appaiati

Misure ripetute (prima/dopo)

Usiamo le differenze fra valori accoppiati: di= xi- yi

La stima puntuale della differenza tra medie delle popolazioni è d= Σdi/n (n numero di copie

del campione) 2

(−)

√∑

La deviazione standard è: Sd= −1

Intervallo di confidenza:

− < < +

−1, −1,

√ √

2 2

− −

CAMPIONI INDIPENDENTI: costruire un intervallo per la differenza tra le medie . il

campione selezionato da una popolazione non influenza il campione selezionato dall’altra

popolazione.

a. VARIANZE NOTE:

b. VARIANZE NON NOTE MA UGUALI:

5. INTERVALLO DI CONFIDENZA PER LA DIFFERENZA TRA PROPORZIONI

L'intervallo di confidenza per p p è:

x – y

Dettagli
Publisher
A.A. 2021-2022
12 pagine
SSD Scienze economiche e statistiche SECS-S/01 Statistica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher veronica067 di informazioni apprese con la frequenza delle lezioni di Statistica e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Cagliari o del prof Pistis Marco.