Statistica - Appunti

Appunti di Statistica con particolare interesse ai seguenti argomenti: statistica inferenziale, popolazione obiettivo, popolazione campionata, campione, induzione statistica, variabili, tecniche di campionamento, scale di misura, distribuzione di frequenza, mediana, moda e misura di dispersione, deviazione standard.

Esame Statistica Medica

Facoltà Medicina e chirurgia

Dal corso del Prof. Cocca Donatella

Università Università degli Studi di Foggia

Publisher kalamaj

A.A. 2011-2012

22 pagine

Appunto

Vota 4,3 / 5 (3)

Scarica

Estratto del documento

Caratteristiche della distribuzione t-Student

S/dove: t rappresenta la t-Student caratterizzata da n -1 gradi di libertà.

La t-Student dipende dalla varianza S, da cui si ottiene la deviazione standard S, e dai gradi di libertà n -1:

S = √[Σ(xi- x̄)²/(n-1)]; S = √[Σ(xi²) - (Σ(xi))²/n]

La t-Student ha n -1 gradi di libertà e livello di significatività α.

Mediante le tavole di distribuzione t-Student con n-1 gradi di libertà, l'intervallo di confidenza sarà pari a: α = P( ≤ μ ≤ √[1 -tS/√n + tS/√n].

Le caratteristiche della distribuzione t-Student sono:

media μ = 0 ed è simmetrica intorno alla media stessa.
varianza σ > 1, mentre σ → 1 per campioni molto grandi.
t varia da -∞ a +∞.
È definita da n-1 gradi di libertà.
Rispetto alla Gauss ha un picco più basso e code più disperse.
Quando n → ∞, la t-Student per n-1 tende

Ad una distribuzione normale, cioè ad una Gauss. Valutiamo ora l'Intervallo di Confidenza per una proporzione o %. Consideriamo una variabile X che segue una distribuzione Binomiale: X ~ B(n, p). All'aumentare di n la Binomiale si approssima ad una distribuzione di Gauss o Normale, cioè: 2B(n, p) → N(μ, σX). Sappiamo che: μ = np. Media: 2σ. Varianza: σ = npq = np(1-p) √2σ = √√deviazione standard: σ = √ = √. Standardizziamo la variabile X tramite la trasformazione: X → Z = (x - μ) / σ. Costruiamo l'intervallo di confidenza intorno a Z: -α ≤ Z ≤ +α. = 1 = P(-α ≤ Z ≤ +α) = P(-α ≤ (x - np) / √(2np(1-p)) ≤ +α) = P[(x - np) / √(2np(1-p)) ≤ α] = P[x ≤ np + α√(2np(1-p))] = P[x ≤ np + c] = P[x + np ≤ c] = P[(x + np) / n ≤ c] = P[(n + c) / (2x + c) ≤ p ≤ (n - c) / (2x + c)].

Tale disuguaglianza è soddisfatta per tutti: 1,2√ – 2p = 2x + c ± 1,2 22 (n + c )√√– –2 ≤ p ≤ P[(2x + c ) - ] 2x + c ) +2 22(n + c ) 2(n + c )–però se x ed n x sono molto grandi si usa la formula:√√– α = P[p^ ≤ p ≤ p^ + c1 - c dove p^ (p stimato) è: p^ = x/n (successi/prove). 9“c” si trova sulle tavole. Se α = 0.05 allora 1 – α = 0.95 e C = ± 1.96. Intervallo di Confidenza per la Differenza di 2 proporzioni o 2%:√= P[(p – ≤ –p ≤ 1–α ^-p ^) Z /n2 p1 2 1 2√≤ (p ^-p ^) + Z /n21 2 μ di 2 v.c. distribuite in modo gaussiano con σ2. Intervallo di Confidenza per la Differenza di 2 note: Consideriamo 2 campioni A e B estratti da 2 popolazioni; indichiamo con x1̄ e x2̄ le medie stimate (campionarie) distribuite secondo una Gauss con medie incognite e varianze note, mentre μ1 e μ2 le medie.

effettive delle 2 popolazioni.
12 22x2¯) ~ N (μ1 μ2, σ /n1 + σ(x1¯ - - /n2)
L'intervallo di confidenza è: √ √– α = P[(x1¯ – ≤ μ1 μ2 ≤ (x1¯1 - x2¯) Z - - x2¯) + Z2varianze σ
Nel caso in cui le sono incognite ma comunque omogenee, uguali, si determinano levarianze campionarie:
12 2 2 2Σ(xi Σxi –S = - x¯) = (Σxi) /n– –n 1 n 122 = “ “S 2 12 22– –poi si calcola la varianza comune: S p = S (n1 1 ) + S (n2 1)–n1 + n2 2
L'intervallo di confidenza è: – α = P[(x1¯ – ≤ μ1 μ2 ≤ (x1¯1 - x2¯) t√ - - x2¯) + t√ –dove t la troviamo sulle tavole della distribuzione t-Student con n1 + n2 2 gradi di libertà.
Verifica delle Ipotesi
Lo scopo della verifica delle ipotesi è di aiutare un ricercatore, un clinico... a prendere una decisione su

Qualche caratteristica di una popolazione, esaminando l'andamento della stessa caratteristica in un campione estratto dalla popolazione.

Nella costruzione di un test di verifica delle ipotesi i passi fondamentali da seguire sono:

Dati: costituiscono la base di un test di verifica delle ipotesi.
Supposizioni: verifica degli assunti sui dati (tipo di distribuzione, eguaglianza delle varianze, indipendenza o dipendenza dei campioni).
Ipotesi statistiche: ipotesi nulla H, ipotesi alternativa H (p1 ≠ p2: (p1 = p2 uguaglianza), cioè >0 1o <, disuguaglianza).
Costruzione del test statistico: è una statistica che può essere calcolata a partire dai dati forniti dal campione. Viene usato per prendere una decisione sulla ipotesi nulla H, cioè rifiutare o accettare l'ipotesi nulla.
Distribuzione test statistico: dipende dalle statistiche e dai dati del campione.
Regola di decisione: l'ipotesi nulla se il valore della statistica per...

Il test che ci dice di rifiutare o non rifiutare l'ipotesi nulla è uno dei valori della zona di rifiuto, oppure ci dice di non rifiutare l'ipotesi nulla se il valore della statistica per il test è uno dei valori della regione di accettazione. La decisione del valore che cade nella zona di rifiuto o di accettazione è fatta sulla base di un desiderato livello di significatività α che rappresenta la probabilità di errore. α e di tipo II β. Gli errori della decisione possono essere di tipo errore di tipo I α, che indica il rifiuto della ipotesi nulla H quando questa in realtà è vera, e errore di tipo II β, che indica il non rifiuto (accettare) l'ipotesi nulla H quando questa in realtà è falsa, e quindi vera H1, l'ipotesi alternativa. Se l'errore α è basso si ha un alto valore dell'errore β.

Il calcolo del test statistico avviene sulla base dei dati del

campione.decisione statistica•: consiste nel rifiutare o accettare l'ipotesi nulla H₀decisione clinica del ricercatore•: è legata alla decisione statistica, ma tiene conto delle conoscenze del ricercatore. La decisione clinica consente di vedere se il test è significativo oppure no.Test per la significatività di una media con variabile distribuita secondo una Gauss e varianza2X ~ N(μ, σnota: ).Un ricercatore è interessato a verificare il livello medio di un enzima in una popolazione.• dati: i dati disponibili sono correlati alla determinazione di un particolare enzima fatto su un campione n = 10 individui estratti dalla popolazione di interesse. Per tale campione è stata calcolata x¯ = 22.• supposizioni: i valori dell'enzima si suppongono distribuiti in modo Gaussiano con varianza nota2σ = 45.• : μ = 25; μ = μipotesi statistica: H₀ = 25 valore fissato.0 0: μ ≠ 25; μ ≠ μH1 0

statistica per il test: si fa riferimento al rapporto critico della distribuzione di campionamento delle μ medie: Z x̄ -= 0σ/ √ distribuzione del test statistico: se l'ipotesi nulla H è vera, la statistica Z segue una distribuzione02di Gauss standard con μ = 0 e σ = 1: Z ~ N(0, 1). regola di decisione: sia α = 0.05, livello di significatività, i valori di Ztab che delimitano la zona di– 19.96 ≤ Zcal ≤ + 1.96, allora rifiutoaccettazione o di rifiuto sono = ± 1.96. Se non avviene cheH .0 μ –calcolo test statistico: Zcal x̄ - __22 25__ = - 1,415.= 0 = √ √σ/ √ / –decisione statistica: non rifiuto H poiché risulta 1.96 < Zcal < + 1.96,0 –cioè 1.96 < - 1,415 < + 1.96.Il test non è significativo al livello di significatività del 5% o 0.05. decisione clinica: possiamo ritenere la media dell'enzima in quella

popolazione pari a 25.2

Test per la significatività di una media con σ incognita:

Un campione di n = 49 individui è stato selezionato per uno studio immunologico.

La variabile di interesse era il Ø dell'alone che si formava sulla pelle come reazione all'Ag:

dati: i dati sono n = 49 Ø misurati sui soggetti; è stata calcolata x̄ = 21 mm ed S = 11 mm.
supposizioni: i Ø sono distribuiti secondo una Gauss con σ incognita.
ipotesi statistica: H0: μ = μ0 vs H1: μ ≠ μ0.
statistica test: si tratta di una statistica t-Student il cui rapporto critico è espresso da μ - t x̄ - gradi di libertà g.l. = n - 1.
distribuzione del test statistico: se l'ipotesi nulla è vera, la statistica segue una distribuzione t-Student con gradi di libertà n - 1.
regola di decisione: sia α = 0.05 livello di significatività del test. I valori di

ttab che delimitano la–zona di accettazione o di rifiuto con n 1 g.l. = 48, sono: ttab = ± 2.01.

11se il valore di tcal non cade nell’intervallo delimitato dai valori di ttab:Si rifiuta H0 ≤ tcal ≤ + 2.01-2.01

μ –calcolo del test statistico: t x¯ - 21 30 - 5,72= 0 = =√S/ 11/√

–decisione statistica: rifiuto H poiché 5.72 < - 2.01 < + 2.01; il test è significativo al livello della0significatività del 5% o 0.05.

decisione clinica: possiamo ritenere che per questa popolazione il valore medio del Ø dell’alone èsenza dubbi diverso dal valore di 30 mm.

Test per la significatività per la differenza di 2 medie, variabili distribuite secondo una Gauss2σcon nota:

dati: valori di calcio in soggetti con deficit di vitamina D. Abbiamo n1 = 12 soggetti sottoposti adieta, N2 = 12 soggetti non sottoposti a dieta. Le misure di calcio sono: x1¯ = 11,1 mg/dl, x2¯ =

7,8mg/dl.

supposizioni: i dati costituiscono 2 campioni indipendenti estratti da popolazioni distribuite secondo una Gauss con σ note: σ = 2.25; σ = 4.

: μ = μipotesi: H = 2.250 1 2

Anteprima

Vedrai una selezione di 6 pagine su 22

Anteprima di 6 pagg. su 22.
Scarica il documento per vederlo tutto.

Scarica

Anteprima di 6 pagg. su 22.
Scarica il documento per vederlo tutto.

Scarica

Anteprima di 6 pagg. su 22.
Scarica il documento per vederlo tutto.

Scarica

Anteprima di 6 pagg. su 22.
Scarica il documento per vederlo tutto.

Scarica

Acquista con carta o PayPal

Scarica i documenti tutte le volte che vuoi

Dettagli

SSD

Scienze economiche e statistiche SECS-S/01 Statistica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher kalamaj di informazioni apprese con la frequenza delle lezioni di Statistica Medica e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Foggia o del prof Cocca Donatella.

Appunti correlati