Appunti completi di Statistica Applicata

Materiale completo da studiare per l'esame intero di Statistica Applicata con la docente Laura Deldossi, con esso ho ottenuto una valutazione di 30/30esimi studiando poco più di 1 …

Esame Statistica applicata

Facoltà Economia

Dal corso del Prof. Deldossi Laura

Università Università Cattolica del "Sacro Cuore"

Publisher Gandalf_il_grigio

A.A. 2019-2020

90 pagine

15 download

Appunto

Vota 4,5 / 5 (2)

Scarica

Estratto del documento

LEZIONE 5: TEST DA UNA POPOLAZIONE - ALCUNE TECNICHE PER LE APPLICAZIONI ECONOMICHE E AZIENDALI

In questa e nella prossima sezione ci occuperemo di:

Principali test parametrici: test sulla media di una popolazione normale; test sulla proporzione di una popolazione bernoulliana, il test sulla varianza di una popolazione normale
Test per due campioni.

Verifica di ipotesi - Si tratta di una procedura inferenziale nella quale sono poste a confronto due diverse ipotesi (H0 e H1) relative generalmente al/ai valore/i assumibili da un parametro. L'obiettivo è quello di individuare, sulla base di un campione osservato, quale delle due ipotesi sul parametro possa essere più verosimile, cioè da quale delle due ipotesi con maggiore probabilità può essere stato generato il campione di osservazioni. Alla base di queste tecniche c'è l'idea che viene esaminato un CAMPIONE di osservazioni dare risposte SULL'INTERA POPOLAZIONE DI ma si vogliono.

RIFERIMENTO. Necessario procedimento INFERENZIALE. Possiamo compiere degli errori ma, se il campione è estratto in modo casuale, siamo in grado di quantificare e controllare questi errori.

H₀ 1Ma quando le distribuzioni sotto le due ipotesi si intersecano????? Cosa potrebbe succedere?? Bisogna limitare la probabilità di compiere gli errori di I tipo e di II tipo. Utilizzando i test statistici queste probabilità possono essere calcolate.

ATT: La probabilità di errore di I e II tipo nel caso di ipotesi H e/o H composte sono funzioni 0 1 dipendenti dal valore del parametro e non scalari.

STATISTICA APPLICATA 2019-2020 1°SEMESTRE

In queste prossime slides introdurremo i test di ipotesi per la risoluzione di alcuni tipici verificad'ipotesi.

problemi di verifica di ipotesi l'interesse è concentrato su alcuni specifici parametri:

Media
Proporzione
Varianza

TEST PER LA MEDIA per verificare l'ipotesi su

particolari valori della media di una popolazione si possono fare test unilaterali sinistri/destri o bilaterali. Consideriamo il caso generale di ipotesi composte.

N.B. Sia l'ipotesi nulla che alternativa ora sono di tipo composto. [L'ipotesi più sfavorevole è quella per cui H è uguale al parametro; quindi ragioneremo con gli stessi strumenti fatti per la prova intermedia]

ASSUMIAMO per ora che la popolazione di interesse segua una distribuzione di tipo NORMALE, cioè che il campione provenga da una V.C. X~N(µ,σ ).

Caso 1: normale con varianza nota

Supponiamo di estrarre un campione casuale semplice da una variabile casuale normale σ 20 con media ignota e varianza nota pari a . Ci chiediamo: l'ipotesi alternativa.

N.B. Indichiamo con µ un generico possibile valore del parametro sotto CHIEDERE APPUNTI GIANLUCAVALORE CRITICO STATISTICA APPLICATA 2019-2020 1°SEMESTRE

Osservazioni:

Caso 2: normale con varianza ignota

Supponiamo

di estrarre un campione casuale semplice da una variabile casuale normale σ^2 con media ignota e varianza ignota pari a . Ci chiediamo: VALORE CRITICO DISTRIBUZIONE t non centrale STATISTICA APPLICATA 2019-2020 1° SEMESTRE Se la normalità non è assumibile allora come è possibile effettuare dei test sulla media? 1. POSSIBILITÀ Assumiamo che la v.c. media campionaria si distribuisca come una v.c. normale, utilizzando il teorema del limite centrale (se n > 100). Ne vedremo un esempio con i test sulla proporzione. È evidente che il più delle volte in questo caso non si conoscerà neppure la varianza. 2. POSSIBILITÀ Se la distribuzione di probabilità non è nota e la numerosità campionaria non consente l'applicazione del teorema del limite centrale (n << 100) è possibile ricorrere ai TEST non PARAMETRICI sulla media o sul confronto di medie (come il test sui ranghi e il test di Wilcoxon). TEST PER LA

PROPORZIONE per verificare l'ipotesi su particolari valori della proporzione π di una popolazione bernoulliana.

Si possono fare test unilaterali sinistri/destri o bilaterali

STATISTICA APPLICATA 2019-2020 1° SEMESTRE

OSSERVAZIONE

La proporzione π coincide con il calcolo della media nel caso di caratteri di tipo dicotomico (codificabili quindi come 0 o 1).
La varianza, in questo caso (caratteri dicotomici) risulta essere funzione della incognita π proporzione e non un valore indipendente da come nel caso di un carattere quantitativo. Dunque se π non è noto non potrà essere nota neppure la varianza. Non avremo due casi come per il test sulla media di una normale.

ASSUMIAMO che la popolazione di interesse segua una distribuzione di tipo bernoulliano, cioè che il campione provenga da una V.C. X~Bin(1,π).

Supponiamo di estrarre un campione casuale semplice da X. Ci chiediamo:

STATISTICA APPLICATA 2019-2020 1° SEMESTRE

ESEMPIO 1

ESEMPIO 2

STATISTICA APPLICATA 2019-2020 1°SEMESTRE

ATTENZIONE: Non bisogna confondere quello che è il valore critico che, nel test statistico, è quel valore che ci consente di prendere una decisione in favore di H₀ o di H₁, e il valore del parametro θ sottoposto a verifica.

Funzione di potenza

Si chiama funzione di potenza π(θ) del test la funzione che descrive la probabilità, al variare di θ in Θ, di rifiutare H₀. Si consideri il seguente test sulla media:

Sotto l'ipotesi nulla, nel punto di frontiera (situazione più sfavorevole) la probabilità di commettere l'errore di 1 tipo. Nel caso dell'esempio, rifiutare H₀ coincide con la probabilità di π(µ=175)=α. Per valori di µ<175 tale probabilità sarà minore di α.

Per calcolare il valore della funzione di potenza sotto H₁ sarà necessario conoscere la distribuzione della statistica test.

T(X) sotto l'ipotesi nell'esempio, è un'ipotesi composta, per individuare tale distribuzione e calcolare la funzione di potenza sarà necessario fissare dei valori per il parametro µ (ad esempio µ=185) e disegnando la funzione interpolando per punti.

Per l'esempio che stiamo considerando la curva rosa rappresenta la funzione di potenza:

N.B: Per valori di µ <175 la funzione di potenza è minore di 0.05. Per µ =175 la funzione di potenza è esattamente 0.05, per µ =181.37 è pari a 0.5, per µ =185 è pari a 0.826. Come è ragionevole attendersi, la funzione di potenza cresce al crescere di µ, ossia al crescere della distanza tra il valore del parametro sotto H e sotto H (le distribuzioni a confronto sono molto separate). Per la stessa ragione si può verificare che la potenza di un test aumenta all'aumentare della dimensione campionaria.

Consistenza e correttezza di un

testUn test si dice: α probabilità di rifiutare l’ipotesiUn test con livello di significatività si dice CORRETTO se lanulla quando questa è falsa è maggiore della probabilità di rifiutarla quando questa è vera,cioè quando: STATISTICA APPLICATA 2019-2020 1°SEMESTRE

Test due popolazioni

TEST PER IL CONFRONTO DI DUE MEDIE

Se siamo interessati ad un test per effettuare il confronto fra le medie di due popolazioniindipendenti possiamo trovarci in una di queste due situazionivalida l’ipotesi di distribuzione normale

A) E’ (verifica effettuata su ciascuno dei duecampioni).

B) Non è verificata l’ipotesi di normalità.

STATISTICA APPLICATA 2019-2020 1°SEMESTRE

Caso 1: normali con varianze note α.

La probabilità di compiere un errore di I tipo è pari adN.B. Oltre ad effettuare un test d’ipotesi con una prefissata α,significatività possiamo

Quest’ultima è

l'opzione generalmente preferita negli output dei pacchetti statistici è sempre calcolare il p-value. Nel caso in cui le varianze siano ignote, PRIMA di poter applicare il test di confronto tra due medie, sotto l'assunzione di normalità, bisogna verificare se le incognite varianze sono tra loro uguali (caso 2a) o diverse (caso 2b). A tale scopo è possibile effettuare un test di uguaglianza tra le varianze di due campioni indipendenti, valido sotto l'ipotesi di normalità. Se si effettua il test di uguaglianza delle varianze e poi, sullo stesso campione, si procede ad effettuare il test di uguaglianza delle medie, stiamo effettuando un test congiunto. In questo caso, se vogliamo garantirci un livello di significatività sul test congiunto pari a (1-α), e dunque una probabilità dell'errore di primo tipo globale pari ad α, dobbiamo applicare la correzione di Bonferroni.

sono p=2 le ipotesi da verificare congiuntamente (come nel caso che stiamoconsiderando: test sulla varianza e test sulla media), allora dobbiamo fissare la probabilitàdell’errore di primo α α αtipo di ogni singolo test, pari ad /p= /2. Quindi se voglio un globale,per il test congiunto, pari a 0.05, i singoli test (sulla varianza e sulle medie) dovranno essereeffettuati con una probabilità dell’errore di primo tipo pari ad α /2=0.025.

TEST PER LA VERIFICA DI UGUAGLIANZA TRA DUE VARIANZE

STATISTICA APPLICATA 2019-2020 1°SEMESTRE

IN EXCEL

A seconda del risultato ottenuto nel test di confronto delle varianze (accetto H0, dunquevarianze uguali o rifiuto H0, dunque varianze diverse), dovrò applicare coerentemente il testdi confronto delle medie per :

- varianze incognite ma uguali => CASO 2a

- varianze incognite ma diverse => CASO 2b

STATISTICA APPLICATA 2019-2020 1°SEMESTRE

Caso 2a: normali con varianze ignote ma

Supponiamo di estrarre un campione casuale semplice di dimensione n da una variabile casuale

STATISTICA APPLICATA 2019-2020 1° SEMESTRE

IN EXCEL

PER LEGGERE GLI OUTPUT SUL TEST IN EXCEL SI RICORDI CHE:

Viene calcolato un valore di una Statistica T e tale valore viene indicato nelle tabelle di output come "t", essendo la distribuzione di questa Statistica quella di una v.c. t di Student

A seconda dei dati, il valore t può essere negativo o positivo.

"P(T<= t) una coda"

Se t < 0, fornisce la probabilità che venga osservato un valore della Statistica inferiore a t.

"P(T <= t) una coda"

Se t >= 0, fornisce la probabilità che

Anteprima

Vedrai una selezione di 10 pagine su 90