Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
TEOREMA DEL LIMITE CENTRALE
Nei casi in cui la distribuzione non è normale e risulta quindi utile riferirsi ad un importante teorema del limite centrale: quando l'ampiezza del campione casuale è sufficientemente grande, la distribuzione della media campionaria può essere approssimata indipendentemente dalla forma della distribuzione dei singoli valori della popolazione.
Come regola di carattere generale, si concorda nell'affermare che quando il campione raggiunge un'ampiezza pari almeno a 30, la distribuzione della media campionaria è approssimativamente normale.
Il teorema del limite centrale svolge un ruolo cruciale in ambito inferenziale, in quanto consente di fare inferenza sulla media della popolazione senza dover conoscere la forma specifica della distribuzione della popolazione.
Per la maggior parte della popolazione, la distribuzione della media campionaria
è approssimativamente normale, purché si considerino campioni di almeno 30 osservazioni.- Se la distribuzione della popolazione è abbastanza simmetrica, la distribuzione della media campionaria è approssimativamente una normale, purché si considerino campioni di almeno 5-15 osservazioni.
- Se la popolazione ha una distribuzione normale, la media campionaria è distribuita secondo la legge normale, indipendentemente dall'ampiezza del campione.
casi, L'intervallo di confidenza includerebbe il valore vero della media incognita.
INTERVALLO DI CONFIDENZA PER LA MEDIA (DEVIAZIONE STANDARD NON NOTA)
Generalmente la deviazione standard della popolazione non è nota, perciò per ottenere un intervallo di confidenza per la media della popolazione, possiamo basarci sulla deviazione standard campionaria.
Se la variabile casuale X ha una distribuzione normale, allora la statistica t segue approssimativamente una distribuzione t di STUDENT in virtù del teorema del limite centrale.
Se la variabile casuale X non ha una distribuzione normale, la statistica t ha comunque approssimativamente una distribuzione t di STUDENT in virtù del teorema del limite centrale.
All'aumentare dei gradi di libertà, la distribuzione si avvicina progressivamente alla distribuzione normale fino a che le due distribuzioni risultano virtualmente identiche.
I valori critici della distribuzione di STUDENT corrispondenti agli appropriati gradi di libertà si ottengono dalla tavola della distribuzione t.
Ogni colonna è
relativa ad un’area a destra della distribuzionegradi di libertàIl significato dei è legato al fatto che per calcolare la varianza è necessariocalcolare prima la media campionaria. n-1
Dato quindi il valore della media campionaria, solo osservazioni campionarie sono liberen-1di variare: ci sono quindi gradi di libertà.
PROPORZIONE
Intervallo di confidenza per la
Data una popolazione le cui unità statistiche possiedono una data caratteristica secondo unadata proporzione, indicata dal parametro π, è possibile costruire un intervallo di confidenzaall’(1-a) per la proporzione nella popolazione:
PARTE 9. VERIFICA DI IPOTESI: TEST SU CAMPIONE
LA VERIFICA DI IPOTESI
verifica di ipotesi
La è una procedura inferenziale che consiste nel fare un’ipotesi su unaquantità incognita della popolazione (parametro) e nel decidere sulla base di campionestatistica campionariacasuale (per mezzo di una se essa è accettabile o
Nella verifica di ipotesi attraverso un campione di osservazioni vogliamo stabilire, con un certo grado di attendibilità, rifiutare o meno l'ipotesi di interesse.
Il problema quindi è prendere una decisione sulla base dei dati campionari.
Il test di ipotesi è il procedimento che consente di rifiutare o non rifiutare l'ipotesi di ricerca.
La verifica di ipotesi parametrica prevede, a partire dall'ipotesi di ricerca, la formulazione di un sistema di ipotesi nulla e alternativa.
Il sistema di ipotesi è composto da un'ipotesi nulla (H0) e da un'ipotesi alternativa (H1).
A fronte dell'ipotesi nulla risulta definita l'ipotesi alternativa:
Ipotesi nulla: l'assenza di differenze o l'assenza di relazioni significative tra gruppi o tra variabili.
All'osservazione conoscenza o la• è dei dati campionari, rappresenta laconvinzione attuale su un dato fenomeno (La terapia attuale per le infezioni è la migliore...)
Ipotesi alternativa: nuova• è specificata come ipotesi opposta all’ipotesi nulla e rappresenta generalmente laipotesi su un dato fenomeno, nuova intuizione del ricercatorela (La nuova terapia è piùefficace di quella attualmente utilizzata?)
Nella verifica di ipotesi però è l’ipotesi nulla che viene sottoposta a verifica e non l’ipotesiH0alternativa. rappresenta quello che è noto su un fenomeno in letteratura e tale ipotesi nonforte evidenzia contrariadeve essere rifiutata a meno che non risulti una
TEST Z PER LA MEDIA (DEVIAZIONE STANDARD NOTA)
Le fasi di un test statistico:
1 PASSO) FORMULAZIONE DELLE IPOTESI
2 PASSO) SCELTA DI UNA STATISTICA TESTstatistica test statistica campionaria
- REGIONE DI ACCETTAZIONE E REGIONE DI RIFIUTO
ipotizzando vera l’ipotesi nulla.Il test statistico procede regione di accettazione regioneSu questa distribuzione vengono definite due regioni, la e ladel rifiuto. valori critici.Le due regioni sono definite in corrispondenza dei Tali valori dipendono dallivello di significatività a, generalmente posto pari al 5% o al 1%.Consideriamo il test bidirezionale e la distribuzione campionaria della statistica test:
- regione di accettazione• La è quindi un’aria molto ampia a cui corrisponde una probabilità(1-a) riferita a tutti i campioni che hanno una media campionaria (o una media campionariastandardizzata) compresa tra due valori critici.
- regione di rifiuto• La è suddivisa in due code a cui corrisponde una probabilità complessivapari ad a, riferita a tutti i
La significatività osservata è la probabilità di osservare un valore della statistica test uguale o più estremo del valore ottenuto dal campione, sotto l'ipotesi nulla.
La probabilità fornita dai dati contro l'ipotesi nulla: Il p-value misura l'evidenza. Minore è il valore del p-value, più è forte l'evidenza contro l'ipotesi nulla.
In base a questo approccio, la regola decisionale è: errore del I tipo (o prima specie): si rifiuta l'ipotesi nulla quando è vera; errore del II tipo (o seconda specie): si accetta l'ipotesi nulla quando è falsa.
L'errore di primo tipo, in genere, si controlla fissando un livello di rischio alfa che si è disposti a tollerare. La scelta di alfa dipende fondamentalmente dai costi che derivano dal commettere un errore di prima specie.
La dimensione del campione è un modo per ridurre l'errore di seconda specie. Aumentare la dimensione del campione consente di individuare anche piccole differenze tra la statistica campionaria e il parametro della popolazione.
I test ad una coda sono utilizzati quando si ha un'ipotesi alternativa che suppone che il parametro sia maggiore o minore di un valore specificato. Ad esempio, il direttore dell'area finanziaria potrebbe essere interessato a verificare l'ipotesi che il peso delle viti contenute nelle scatole sia superiore ai 268 grammi. In tal caso, essendo il prezzo delle scatole basato su un peso di 368 grammi, la società subirebbe delle perdite.
In questo caso si intende stabilire se il peso medio è...
superiore a 368 grammi. In questo caso: H0=µ= 368, H1= µ >368. La regione di rifiuto è interamente racchiusa nella coda destra della distribuzione statistica test, perchè rifiutiamo l’ipotesi nulla H0 solo se la media campionaria è significativamente superiore a 368 grammi. Quando la regione di rifiuto è contenuta per intero in una coda della distribuzione della statistica test, si parla di IL TEST DI IPOTESI T PER LA MEDIA (DEVIAZIONE STANDARD NON NOTA). In molte applicazioni la deviazione standard della variabile nella popolazione non è nota ed è quindi necessario stimarla con la deviazione standard campionaria S. Se si assume che la variabile abbia distribuzione normale.