Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
Formattazione del testo
QU.Q(KII 0IXIOI 11.0001 0.0001 0.0001O.OQCllO<XII ru:IIXII 0.0001 0.00,01 0.0001 110001go(J} llDl»} 0(0)1 O[l()JII OIIIJCJI0,(l()(IJOOOOlCIOCKl:I 0 2CIDQ,I 0 (l,0001 l1.000\ 00000000, '0 ;0.000(0QOIO 0 IOOI o.ocneOCll!J 0.00H,00 DOlf. 000'14000&,- Q11 o.-L!I-:LJ 0.0081' GOOS.0.00B □ blllllOD.0122 00119 00116 0 '11.(]I -ll l!>O 001 DQl4O.D1 0.01&01)1!).! 0..02J1CO2 0�nnYi70038,1 O.OH01:.0.:i, 0.0 !,0 =dell fntera dis•tribuzione si trnva nella coda inferiore a Z2'.5o/o -1.96,if1■dodm I =0 025 2 S%(. .1o.- JD 0.7019a. l.Sa. -;,0.7961o..a::u.e2·.fi%,dell in era rova a Z 1.9,6diSirilluzione si · nell'a ooda superiore up=Vediamo nelle due slide sopra che se vado a prendere -1.96 nelle tabelle della distribuzione Z ho 0.025 e sevado a prendere +1.96 ho 0.975 e quindi resta un altro 0.025 che costituisce la seconda coda della miadistribuzione di frequenza normale standard.Quindi facendo la formula inversa della formula
per passare da Xi a Zi, otteniamo che ciascun valore di Xisarà uguale alla media parametrica +- la deviazione standard moltiplicata per Zi.
La cosa eccezionale è che con la formula inversa, possiamo passare da una distribuzione che conosciamo perché è tabulata (normale standard) ad una qualsiasi altra distribuzione normale, perché l'area sotto la curva rimane esattamente la stessa; quindi, possiamo trovare un Xsupper ed un Xlower attraverso questa formula inversa. A questo punto tra Xsupper e Xlower avrò il 95% delle probabilità delle mie osservazioni.
Questo cosa ci permette di fare?
Ci permette di testare un'ipotesi per esempio, quindi tornando alla lunghezza del becco dei fagiani in Toscana, faccio questa osservazione di un fagiano che ha un becco lungo 15.1 mm, vediamo dalla slide che la media parametrica è sugli 11 mm, mentre la corda Xsup inizia a 13.52 mm. Questo valore osservato di 15.1 mm ricade nella regione di
rifiuto dell'ipotesi nulla; quindi, rifiuto l'ipotesi nulla con il rischio dello 0.05 di commettere errore di tipo I, perché ricordiamo che 1/20 potrebbe accadere di trovare effettivamente un fagiano con un becco di 15.1 mm e che quest'ultimo faccia parte della nostra popolazione. Abbiamo in questo caso un test a una coda perché il becco è troppo lungo; quindi, siamo andati a cercare sulle tavole lo 0.05 e abbiamo trovato questo valore che è 1.645 che ci isola il 95% prima della coda del 5%. Inserisco questo valore nella formula per trovare Xsupper= media parametrica+(radice quadrata della varianza x Zsup)= 13.52 mm. Ho trovato quindi la mia coda Xsupper che mi isola il 95% della probabilità e mi dà la mia coda che corrisponde alla regione di rifiuto dell'ipotesi nulla. A questo punto prendo il mio valore di 15.1 mm e vedo che si trova nella zona di rifiuto dell'ipotesi nulla. Rifiuto l'ipotesi nulla conProbabilità del 5% di commettere un errore di tipo I. Chiaramente potremmo stringere la coda fino ad arrivare all'1% della regione di rifiuto dell'ipotesi nulla. Mettiamo che decidiamo di avere questa coda all'1% e andiamo a prendere il valore corrispondente di Zsupper che mi isola il mio 99%. Vediamo quindi che il valore che mi isola il mio 99% è 2.327, quindi vado a ricalcolarmi il mio Xsup= 11+(1.53x2.327) = 14.56mm. Quindi in questo caso l'esemplare di fagiano con 15.11mm di becco andrebbe comunque nella zona di rifiuto della mia ipotesi nulla, ma rischio con altri valori di commettere errori di tipo II. Per esempio, se prendessi un esemplare con un becco di 14.5 mm, allora accetterei l'ipotesi nulla, magari erroneamente perché quel fagiano non fa parte della popolazione di fagiani della Toscana esaminata finora. Quindi morale della favola --> non bisogna stringere troppo le code. Chiariamo la differenza tra un test a due code e un test a una coda.
Nell'esempio della moneta truccata avevamo un test a due code, perché nella nostra osservazione iniziale non avevamo definito se la moneta cadesse più volte testa o più volte croce di quanto ci saremmo aspettati per la probabilità. Se avessimo osservato che la moneta cadesse troppo spesso testa, a quel punto avremmo fatto un test a una sola coda dove il 5% si sarebbe trovato solo in una coda, e non in due. Quindi nei test a 1 coda ho informazioni più dettagliate e riesco quindi a eliminare una delle due code. Noi ci troviamo a compiere dei test statistici un po' più complicati, con campioni estratti da popolazioni reali. Quindi, stiamo studiando una popolazione ed estraiamo un certo numero di osservazioni. Abbiamo detto che la popolazione può essere composta da individui, oppure da superfici, volumi, numero di specie, etc... Ora dobbiamo passare al concetto di distribuzione di frequenza delle medie campionarie. Che vuol dire che, se estraggo un campione di dimensione n da una popolazione, calcolo la media di quel campione e ripeto questo processo molte volte, otterrò una distribuzione delle medie campionarie.dire? Abbiamo una popolazione che ha una media parametrica uguale a 4.2 e una varianza di 27.4, qualsiasi variabile X può essere descritta da una distribuzione di frequenza con questi due parametri: locazione e dispersione. Se dovessimo campionare la stessa popolazione mille volte, potremmo allora creare una distribuzione di frequenza delle medie campionarie e delle varianze campionarie. Dato che le varie medie e varianze campionarie sicuramente saranno tutte diverse tra loro, allora creando questa distribuzione di frequenza delle medie campionarie posso ottenere sicuramente uno studio accurato della mia variabile. Questa è la distribuzione di frequenza delle medie campionarie e posso da questa distribuzione posso estrarre un'altra media campionaria che a questo punto sarà molto accurata. Quindi chiaramente in questo caso avremo una media campionaria che è sempre più vicina alla media parametrica, inoltre, più aumenta n più la stima del parametro sarà precisa.parametro di dispersione che influisce sulla distribuzione delle medie campionarie è la deviazione standard. Aumentando la deviazione standard, la distribuzione delle medie campionarie si allarga, mentre diminuendo la deviazione standard, la distribuzione si restringe. La deviazione standard è una misura di quanto i dati si discostano dalla media. Quindi, se i dati sono molto dispersi, cioè hanno una grande deviazione standard, le medie campionarie saranno più variabili. Al contrario, se i dati sono poco dispersi, cioè hanno una piccola deviazione standard, le medie campionarie saranno meno variabili. Inoltre, la deviazione standard è anche influenzata dalla taglia del campione. Aumentando la taglia del campione, la deviazione standard delle medie campionarie diminuisce. Questo è noto come l'effetto della riduzione della deviazione standard. In pratica, più grande è il campione, più accurate saranno le stime delle medie campionarie. In conclusione, la deviazione standard è un parametro importante da considerare quando si analizzano le distribuzioni delle medie campionarie. Essa influisce sulla larghezza della distribuzione e sulla precisione delle stime delle medie campionarie.esempio per cui il teorema del limite centrale non è applicabile è l'esempio delle distribuzioniasimmetriche, questo è risolvibile con una trasformazione logaritmica dei dati che alla fine ci porta a una distribuzione normale. Gli intervalli di confidenza ci interessano perché ci danno una misura della accuratezza della nostra stima della media e inoltre possono essere utilizzati per il test di ipotesi. La varianza della distribuzione di medie campionarie è uguale alla varianza della popolazione campionata diviso la taglia del campione n. La deviazione standard sarà quindi la radice quadrata della varianza della distribuzione delle medie campionarie diviso per n. La deviazione standard avrà la stessa unità di misura della media, mentre nella varianza abbiamo l'unità di misura al quadrato. L'errore standard è la deviazione standard della distribuzione delle medie campionarie ed indica quanto sarebberoVariabili le medie campionarie se numerosi campioni venissero presi dalla popolazione. Riprendiamo la lunghezza del becco dei fagiani. Quindi abbiamo questa popolazione di fagiani con una media parametrica di 11 mm e una varianza di 2.34. In slide sopra vediamo la distribuzione di frequenza di 500 campioni, costituiti ognuno da 10 fagiani. Osserviamo quindi l'ottenimento di una distribuzione normale centrata sulla media parametrica --> ciò vuol dire che con una distribuzione di frequenza delle medie campionarie, mi avvicino all'aumentare di n, sempre più a una distribuzione di frequenza che rispecchia la reale popolazione, quindi la media campionaria della distribuzione di frequenza delle medie campionarie, all'aumentare di n, si avvicina sempre più alla media parametrica della popolazione. Con le formule inverse della distribuzione Z, abbiamo la possibilità quindi di stabilire dei valori superiori e inferiori che ci isolano il 95% delle probabilità.
Quindi in questo caso la media campionaria la chiamiamo B, che sarebbe la media campionaria dei dieci individui. A questo punto la varianza campionaria della distribuzione di frequenza delle medie campionarie sarà la varianza della distribuzione normale diviso per n che è 10. Abbiamo detto quindi che la varianza è 2.34/10 che fa 0.234. L'errore standard sarà quindi la radice quadrata di 0.234 che corrisponde a 0.434. A questo punto Bupper sarà dato dalla media parametrica + Zupper x l'errore standard = 11 + 1.96 x 0.434 = 11.851. Blower sarà = 11 - 1.96 x 0.434 = 10.149. Quindi tra 10.149 e 11.851 avrò il 95% delle mie medie campionarie. A questo punto ho sia un valore medio che posso stimare e so anche qual è l'accuratezza. Se l'intervallo fosse troppo grande, troverei pure un valore medio ma non avrei idea di dove si trovi il valore vero. Mentre se l'intervallo è molto piccolo avròun’accuratezza maggiore. Quindi abbiamo visto che qualunque distribuzione all’aumentare di n diventa normale (tranne lemultimodali e le asimmetriche) e quindi posso fare una distribuzione di frequenza delle medie campionariedei miei vari esperimenti, poi grazie al fatto che i valori di Z sono tabulati, posso standardizzare ed ottenereil mio intervallo di confidenza. Quindi ogni volta che vado a prendere un B medio (media campionaria di dieci fagiani) avrò il 95% diprobabilità di trovarlo all’interno del mio intervallo di confidenza, e il 5% di probabilità che non ci sia. Intervallo di confidenza: intervallo all’interno del quale ho il 95% di possibilità di trovare la mediaparametrica. Se la nostra misura è accurata la stima della media parametrica sarà buona,