Anteprima
Vedrai una selezione di 6 pagine su 23
Riassunto esame Statistica inferenziale, Prof. Massa Paola, libro consigliato Statistica, Simone Borra Pag. 1 Riassunto esame Statistica inferenziale, Prof. Massa Paola, libro consigliato Statistica, Simone Borra Pag. 2
Anteprima di 6 pagg. su 23.
Scarica il documento per vederlo tutto.
Riassunto esame Statistica inferenziale, Prof. Massa Paola, libro consigliato Statistica, Simone Borra Pag. 6
Anteprima di 6 pagg. su 23.
Scarica il documento per vederlo tutto.
Riassunto esame Statistica inferenziale, Prof. Massa Paola, libro consigliato Statistica, Simone Borra Pag. 11
Anteprima di 6 pagg. su 23.
Scarica il documento per vederlo tutto.
Riassunto esame Statistica inferenziale, Prof. Massa Paola, libro consigliato Statistica, Simone Borra Pag. 16
Anteprima di 6 pagg. su 23.
Scarica il documento per vederlo tutto.
Riassunto esame Statistica inferenziale, Prof. Massa Paola, libro consigliato Statistica, Simone Borra Pag. 21
1 su 23
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

INTERVALLO DI CONFIDENZA PER LA VARIANZA

Per costruire un intervallo di confidenza per la varianza di una popolazione con distribuzione

2

Normale con media e varianza ignote, è necessario ricorrere ad uno stimatore opportuno: la

2

varianza campionaria . La variabile casuale 2

( − 1) 2

~

−1

2

− 1

cioè si distribuisce come una variabile casuale Chi-quadrato con gradi di libertà.

2 2 2

2 ⁄

( ),

( > = 2

)

Si indica con il numero reale tale che e con quel numero reale

⁄ ⁄ ⁄

2 2 1− 2

2

2 ⁄

( ).

( > = 1 − 2

)

tale che Si ottiene:

1− 2 2 2

2

( ≤ ≤ = 1 −

)

⁄ ⁄

1− 2 2

Da ciò si ottiene: 2

( − 1)

2 2

≤ ≤ = 1 −

( )

⁄ ⁄

1− 2 2

2

2 2

( − 1) ( − 1)

2

( ≤ ≤ )=1−

2 2

⁄ ⁄

2 1− 2 1 −

Lo stimatore intervallo di confidenza per la varianza della popolazione al livello sarà:

2 2

( − 1) ( − 1)

[ ; ]

2 2

⁄ ⁄

2 1− 2

Chi-quadrato

La variabile casuale Chi-quadrato è una distribuzione asimmetrica, continua e definita per valori

(0; +∞).

reali non negativi La funzione di densità dipende da un unico parametro: grado di libertà,

cioè un valore intero positivo indicato con g. 2

~ ()

La media e la varianza della variabile casuale sono date da:

() =

() = 2

All’aumentare di g, la distribuzione tende ad una Normale. 8

DETERMINAZIONE DELLA NUMEROSITÀ CAMPIONARIA

lunghezza dell’intervallo dipende, oltre che dalla varianza e dal

Negli intervalli di confidenza, la

livello di confidenza, anche dalla numerosità campionaria n. Inoltre, quanto minore è la semi-

lunghezza dell’intervallo, tanto maggiore è la precisione della stima intervallare.

Nella maggior parte dei problemi di vita reale, si vuole determinare in anticipo la dimensione

campionaria necessaria ad assicurare una certa precisione.

Si prenda in considerazione una variabile casuale X che si distribuisce come una Normale con

media e varianza nota. dell’intervallo non

La dimensione campionaria necessaria deve assicurare che la semi-lunghezza

:

superi un certo valore

= → √ =

⁄ ⁄

2 2

√ 2

= ( )

2

Se il valore ottenuto non è un numero intero, si prenderà come dimensione campionaria il numero

intero successivo. 2

Nel caso in cui la varianza sia ignota, si utilizza una stima della varianza della popolazione che

deve essere già nota prima di procedere all’estrazione del campione. Tale stima può essere

ottenuta tramite un campione pilota. 2

= ( )

2

Se l’intervallo di confidenza di riferisce ad una proporzione, fissato il valore , la numerosità

campionaria sarà data da: ̅(1 ̅)

2

= ⁄

2 2

9

Test d’ipotesi

Una delle maggiori aree di interesse dell’inferenza riguarda la verifica delle ipotesi statistiche.

Il primo importante passo nella costruzione di un test statistico consiste nella definizione delle due

possibili ipotesi, tra loro alternative, tra cui dobbiamo scegliere in base al risultato campionario.

Per ipotesi statistica si intende una congettura riguardante un parametro della popolazione.

Se l’ipotesi riguarda uno o più parametri della distribuzione di probabilità della popolazione, si

parlerà di test parametrico.

Nell’approccio di Neymar-Pearson, si distinguono due ipotesi contrapposte:

• → è l’ipotesi ritenuta vera fino a prova contraria;

Ipotesi nulla, indicata con 0

• → è l’ipotesi contrapposta a quella nulla,

Ipotesi alternativa, indicata con considerata

1

più verosimile in base al risultato campionario.

ossia l’insieme di tutti i valori che può assumere

.

Si indica con lo spazio parametrico,

Le due ipotesi possono essere indicate attraverso un sistema:

: ∈

0 0

{ : ∈

1 1

Le ipotesi possono essere:

• → quando specifica un singolo valore numerico;

Semplici

• → quando

Composte specifica un intervallo di valori. Inoltre, può essere:

o ≥

Unidirezionale se specifica un solo intervallo ( );

0

o ≠

Bidirezionale se specifica due intervalli ( ).

0

Solitamente l’ipotesi nulla è semplice e quella alternativa è composta.

Il rifiuto o l’accettazione dell’ipotesi nulla dipende dal campione osservato: se l’informazione che si

ricava dal campione contrasta con l’ipotesi nulla, si rifiuterà tale ipotesi; in caso contrario si

accetterà l’ipotesi nulla. Tale procedura chiamata test statistico.

test d’ipotesi)

Un test statistico (o è una regola che permette di discriminare i campioni che

portano all’accettazione dell’ipotesi nulla da quelli che portano al suo rifiuto.

La statistica campionaria (es. media campionaria) utilizzata per decidere se un determinato

campione porta all’accettazione o al rifiuto dell’ipotesi nulla viene chiamata statistica test. Una

caratteristica fondamentale di una statistica test è che la sua distribuzione campionaria deve

sotto l’ipotesi nulla.

essere nota

L’insieme dei valori che portano all’accettazione dell’ipotesi nulla è chiamata regione di

L’insieme dei valori che portano al rifiuto dell’ipotesi nulla è chiamata

accettazione. regione di

rifiuto.

I valori appartenenti alla regione di accettazione o di rifiuto dipendono dal valore scelto, detto

livello di significatività del test: maggiore è il suo valore, più ampia sarà la regione di rifiuto. I valori

generalmente usati per sono 0,1 o 0,05 o 0,01.

I valori che delimitano la zona di rifiuto sono detti valori critici. 10

TEST PER LA MEDIA

Si ipotizzi di voler analizzare la media campionaria per un campione casuale che proviene da una

2

=

popolazione Normale con media e varianza nota. In questo caso la statistica test ha

0

distribuzione Normale standardizzata ̅ −

0

= ~(0; 1)

che indica il valore della media ipotizzata nell’ipotesi nulla.

con 0 Ipotesi alternativa Regione di rifiuto

: > ≥

1 0

: < ≤ −

1 0

|| ≥

: ≠ ⁄

2

1 0

Si ipotizzi di voler analizzare la media campionaria per un campione casuale che proviene da una

2

=

popolazione Normale con media e varianza ignota. In questo caso la statistica test ha

0

distribuzione t di Student ̅ −

0

= ~( − 1)

che indica il valore della media ipotizzata nell’ipotesi nulla

con e con S che indica la radice

0 2

quadrata dello stimatore corretto della varianza .

Ipotesi alternativa Regione di rifiuto

: > ≥

1 0

: < ≤ −

1 0

|| ≥

: ≠ ⁄

2

1 0

TEST PER LA PROPORZIONE

Si ipotizzi di voler analizzare la proporzione campionaria per un campione casuale che proviene da

una popolazione Bernoulliana. In questo caso, per n che tende a infinito, la statistica test ha

distribuzione Normale standardizzata ̅ − 0

= ~(0; 1)

(1 − )

√ 0 0 nell’ipotesi nulla.

con che indica il valore della proporzione ipotizzato

0 Ipotesi alternativa Regione di rifiuto

: > ≥

1 0

: < ≤ −

1 0

|| ≥

: ≠ ⁄

2

1 0 11

TEST PER LA VARIANZA

Si ipotizzi di voler analizzare la varianza campionaria per un campione casuale che proviene da

una popolazione Normale. In questo caso la statistica test ha distribuzione Chi-quadrato

2

( − 1) ~ℎ( − 1)

02

02 2

nell’ipotesi nulla

con che indica il valore della varianza ipotizzata e con lo stimatore corretto

della varianza. Ipotesi alternativa Regione di rifiuto

2

( − 1)

02 2

2 ≥

: >

1 02

2

( − 1) 2

02

2 ≤

: <

1 1−

02

2

( − 1) 2

≤ ⁄

1− 2

02

02

2

: ≠

1 2

( − 1) 2

/2

02

PROCEDURA PER LA VERIFICA DI IPOTESI

1. Definizione del sistema di ipotesi

2. Scelta della statistica test

3. Scelta del livello di significatività e della numerosità campionaria n

4. Definizione della regione di rifiuto

5. Estrazione del campione

6. Calcolo della statistica test

7. Decisione 12

Test basati su campioni indipendenti provenienti da due popolazioni

è interessati a comparare i parametri di due popolazioni sulla base dell’osservazione di due

Si

campioni indipendenti di dimensione n e n . In particolare, si descriverà il caso di due popolazioni

1 2

con distribuzione Normale (nel caso di media e varianza) o Bernoulliana (nel caso di proporzione).

TEST SULLE MEDIE

Si prendano in considerazione due popolazioni, X e X :

1 2

12 )

~( ;

1 1 22 )

~( ;

2 2

dove e rappresentano le medie delle popolazioni, i parametri incogniti di interesse. Si vuole

1 2

verificare se tra le due medie sussiste differenza. Si stabiliscono dunque le seguenti ipotesi da

verificare: : =

Dettagli
Publisher
A.A. 2022-2023
23 pagine
SSD Scienze economiche e statistiche SECS-S/01 Statistica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher noemi.sto di informazioni apprese con la frequenza delle lezioni di Statistica inferenziale e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Napoli - Parthenope o del prof Massa Paola.