Anteprima
Vedrai una selezione di 10 pagine su 131
Corso Integrale Metodi Statistici (con Quiz) Pag. 1 Corso Integrale Metodi Statistici (con Quiz) Pag. 2
Anteprima di 10 pagg. su 131.
Scarica il documento per vederlo tutto.
Corso Integrale Metodi Statistici (con Quiz) Pag. 6
Anteprima di 10 pagg. su 131.
Scarica il documento per vederlo tutto.
Corso Integrale Metodi Statistici (con Quiz) Pag. 11
Anteprima di 10 pagg. su 131.
Scarica il documento per vederlo tutto.
Corso Integrale Metodi Statistici (con Quiz) Pag. 16
Anteprima di 10 pagg. su 131.
Scarica il documento per vederlo tutto.
Corso Integrale Metodi Statistici (con Quiz) Pag. 21
Anteprima di 10 pagg. su 131.
Scarica il documento per vederlo tutto.
Corso Integrale Metodi Statistici (con Quiz) Pag. 26
Anteprima di 10 pagg. su 131.
Scarica il documento per vederlo tutto.
Corso Integrale Metodi Statistici (con Quiz) Pag. 31
Anteprima di 10 pagg. su 131.
Scarica il documento per vederlo tutto.
Corso Integrale Metodi Statistici (con Quiz) Pag. 36
Anteprima di 10 pagg. su 131.
Scarica il documento per vederlo tutto.
Corso Integrale Metodi Statistici (con Quiz) Pag. 41
1 su 131
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

TEOREMA DEL LIMITE CENTRALE

Nei casi in cui la distribuzione non è normale e risulta quindi utile riferirsi ad un importante teorema del limite centrale: quando l'ampiezza del campione casuale è sufficientemente grande, la distribuzione della media campionaria può essere approssimata indipendentemente dalla forma della distribuzione dei singoli valori della popolazione.

Come regola di carattere generale, si concorda nell'affermare che quando il campione raggiunge un'ampiezza pari almeno a 30, la distribuzione della media campionaria è approssimativamente normale.

Il teorema del limite centrale svolge un ruolo cruciale in ambito inferenziale, in quanto consente di fare inferenza sulla media della popolazione senza dover conoscere la forma specifica della distribuzione della popolazione.

Per la maggior parte della popolazione, la distribuzione della media campionaria

è approssimativamente normale, purché si considerino campioni di almeno 30 osservazioni.
  • Se la distribuzione della popolazione è abbastanza simmetrica, la distribuzione della media campionaria è approssimativamente una normale, purché si considerino campioni di almeno 5-15 osservazioni.
  • Se la popolazione ha una distribuzione normale, la media campionaria è distribuita secondo la legge normale, indipendentemente dall'ampiezza del campione.
Dalla distribuzione campionaria della media campionaria alla costruzione dell'intervallo di confidenza per la media. Sapendo che la media campionaria si distribuisce come una normale, consideriamo la standardizzazione della media campionaria per passare ad una variabile normale di media 0 e varianza 1: Osserviamo che per alcuni campioni la stima per intervallo al 95% di μ è corretta mentre per altri non lo è. Se potessimo ripetere il campionamento infinite volte, nel 95% dei casi l'intervallo di confidenza conterrà il vero valore di μ.

casi, L'intervallo di confidenza includerebbe il valore vero della media incognita.

INTERVALLO DI CONFIDENZA PER LA MEDIA (DEVIAZIONE STANDARD NON NOTA)

Generalmente la deviazione standard della popolazione non è nota, perciò per ottenere un intervallo di confidenza per la media della popolazione, possiamo basarci sulla deviazione standard campionaria.

Se la variabile casuale X ha una distribuzione normale, allora la statistica t segue approssimativamente una distribuzione t di STUDENT in virtù del teorema del limite centrale.

Se la variabile casuale X non ha una distribuzione normale, la statistica t ha comunque approssimativamente una distribuzione t di STUDENT in virtù del teorema del limite centrale.

All'aumentare dei gradi di libertà, la distribuzione si avvicina progressivamente alla distribuzione normale fino a che le due distribuzioni risultano virtualmente identiche.

I valori critici della distribuzione di STUDENT corrispondenti agli appropriati gradi di libertà si ottengono dalla tavola della distribuzione t.

Ogni colonna è

relativa ad un’area a destra della distribuzionegradi di libertà
Il significato dei è legato al fatto che per calcolare la varianza è necessariocalcolare prima la media campionaria. n-1
Dato quindi il valore della media campionaria, solo osservazioni campionarie sono liberen-1di variare: ci sono quindi gradi di libertà.

PROPORZIONE
Intervallo di confidenza per la
Data una popolazione le cui unità statistiche possiedono una data caratteristica secondo unadata proporzione, indicata dal parametro π, è possibile costruire un intervallo di confidenzaall’(1-a) per la proporzione nella popolazione:

PARTE 9. VERIFICA DI IPOTESI: TEST SU CAMPIONE
LA VERIFICA DI IPOTESI
verifica di ipotesi
La è una procedura inferenziale che consiste nel fare un’ipotesi su unaquantità incognita della popolazione (parametro) e nel decidere sulla base di campionestatistica campionariacasuale (per mezzo di una se essa è accettabile o

Nella verifica di ipotesi attraverso un campione di osservazioni vogliamo stabilire, con un certo grado di attendibilità, rifiutare o meno l'ipotesi di interesse.

Il problema quindi è prendere una decisione sulla base dei dati campionari.

Il test di ipotesi è il procedimento che consente di rifiutare o non rifiutare l'ipotesi di ricerca.

La verifica di ipotesi parametrica prevede, a partire dall'ipotesi di ricerca, la formulazione di un sistema di ipotesi nulla e alternativa.

Il sistema di ipotesi è composto da un'ipotesi nulla (H0) e da un'ipotesi alternativa (H1).

A fronte dell'ipotesi nulla risulta definita l'ipotesi alternativa:

Ipotesi nulla: l'assenza di differenze o l'assenza di relazioni significative tra gruppi o tra variabili.

All'osservazione conoscenza o la• è dei dati campionari, rappresenta laconvinzione attuale su un dato fenomeno (La terapia attuale per le infezioni è la migliore...)

Ipotesi alternativa: nuova• è specificata come ipotesi opposta all’ipotesi nulla e rappresenta generalmente laipotesi su un dato fenomeno, nuova intuizione del ricercatorela (La nuova terapia è piùefficace di quella attualmente utilizzata?)

Nella verifica di ipotesi però è l’ipotesi nulla che viene sottoposta a verifica e non l’ipotesiH0alternativa. rappresenta quello che è noto su un fenomeno in letteratura e tale ipotesi nonforte evidenzia contrariadeve essere rifiutata a meno che non risulti una

TEST Z PER LA MEDIA (DEVIAZIONE STANDARD NOTA)

Le fasi di un test statistico:

1 PASSO) FORMULAZIONE DELLE IPOTESI

2 PASSO) SCELTA DI UNA STATISTICA TESTstatistica test statistica campionaria

  1. REGIONE DI ACCETTAZIONE E REGIONE DI RIFIUTO

ipotizzando vera l’ipotesi nulla.Il test statistico procede regione di accettazione regioneSu questa distribuzione vengono definite due regioni, la e ladel rifiuto. valori critici.Le due regioni sono definite in corrispondenza dei Tali valori dipendono dallivello di significatività a, generalmente posto pari al 5% o al 1%.Consideriamo il test bidirezionale e la distribuzione campionaria della statistica test:

  • regione di accettazione• La è quindi un’aria molto ampia a cui corrisponde una probabilità(1-a) riferita a tutti i campioni che hanno una media campionaria (o una media campionariastandardizzata) compresa tra due valori critici.
  • regione di rifiuto• La è suddivisa in due code a cui corrisponde una probabilità complessivapari ad a, riferita a tutti i
campioni che hanno una media campionaria esterna ai valori critici. Il test di ipotesi discrimina quindi i campioni che portano all'accettazione dell'ipotesi nulla da quelli che portano al suo rifiuto secondo questa regola: Ipotizzando vera l'ipotesi nulla, considero la distribuzione campionaria della statistica test e su questa definiscono le regioni di accettazione e di rifiuto. I valori della statistica test (ovvero le medie campionarie) che cadono nella regione di accettazione portano all'accettazione dell'ipotesi nulla (perché molto probabili sotto l'ipotesi nulla). I valori della statistica test (ovvero le medie campionarie) che cadono nella regione di rifiuto portano al rifiuto dell'ipotesi nulla (perché poco probabili). La regola decisionale del test di ipotesi per a=5%, è la seguente: IL p-value Un altro modo per evidenziare il risultato del test è quello di calcolare il p-value (detto anche livello di significatività).

La significatività osservata è la probabilità di osservare un valore della statistica test uguale o più estremo del valore ottenuto dal campione, sotto l'ipotesi nulla.

La probabilità fornita dai dati contro l'ipotesi nulla: Il p-value misura l'evidenza. Minore è il valore del p-value, più è forte l'evidenza contro l'ipotesi nulla.

In base a questo approccio, la regola decisionale è: errore del I tipo (o prima specie): si rifiuta l'ipotesi nulla quando è vera; errore del II tipo (o seconda specie): si accetta l'ipotesi nulla quando è falsa.

L'errore di primo tipo, in genere, si controlla fissando un livello di rischio alfa che si è disposti a tollerare. La scelta di alfa dipende fondamentalmente dai costi che derivano dal commettere un errore di prima specie.

La dimensione del campione è un modo per ridurre l'errore di seconda specie. Aumentare la dimensione del campione consente di individuare anche piccole differenze tra la statistica campionaria e il parametro della popolazione.

I test ad una coda sono utilizzati quando si ha un'ipotesi alternativa che suppone che il parametro sia maggiore o minore di un valore specificato. Ad esempio, il direttore dell'area finanziaria potrebbe essere interessato a verificare l'ipotesi che il peso delle viti contenute nelle scatole sia superiore ai 268 grammi. In tal caso, essendo il prezzo delle scatole basato su un peso di 368 grammi, la società subirebbe delle perdite.

In questo caso si intende stabilire se il peso medio è...

superiore a 368 grammi. In questo caso: H0=µ= 368, H1= µ >368. La regione di rifiuto è interamente racchiusa nella coda destra della distribuzione statistica test, perchè rifiutiamo l’ipotesi nulla H0 solo se la media campionaria è significativamente superiore a 368 grammi. Quando la regione di rifiuto è contenuta per intero in una coda della distribuzione della statistica test, si parla di IL TEST DI IPOTESI T PER LA MEDIA (DEVIAZIONE STANDARD NON NOTA). In molte applicazioni la deviazione standard della variabile nella popolazione non è nota ed è quindi necessario stimarla con la deviazione standard campionaria S. Se si assume che la variabile abbia distribuzione normale.

Dettagli
A.A. 2019-2020
131 pagine
2 download
SSD Scienze matematiche e informatiche MAT/06 Probabilità e statistica matematica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher paulteofil.dobos di informazioni apprese con la frequenza delle lezioni di Metodi statistici e probabilistici per l'ingegneria e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Padova o del prof Arboretti Giancristofaro Rosa.