Appunti di Statistica Medica

Appunti delle lezioni della prof.ssa Dormi, a.a. 2016-17. Medicina canale A basati su appunti personali del publisher presi alle lezioni della prof.ssa Dormi dell’università degli …

Esame Statistica medica

Facoltà Medicina e chirurgia

Dal corso del Prof. Dormi Ada

Università Università degli Studi di Bologna

Publisher yremsl

A.A. 2016-2017

43 pagine

10 download

Appunto

Vota 5,0 / 5 (1)

Scarica

Estratto del documento

TECNICHE NON PARAMETRICHE

Se il campione non è molto numeroso non è facile stabilire se la distribuzione è normale; bisogna applicare le tecniche

distribution free dette tecniche non parametriche. (ad es con parametri in scala numerica continua non distribuiti

normalmente o con grande variabilità).

Alcune volte è possibile normalizzare i dati con le trasformazioni log o arcoseno --> tecniche di parametrizzazione

I test non parametrici non lavorano sulla media, ma sul rango: i valori vengono distribuiti in ordine crescente, e ogni elemento

ha una posizione che rappresenta il suo rango.

Test parametrici Test non parametrici U di Mann-Whitney

Test t di student per campioni indipendenti U di Mann-Whitney

Test t di student per dati appaiati Wilcoxon per dati appaiati Tecnica non parametrica per confrontare 2

ANOVA - analisi della varianza Kruskal-Wallis campioni indipendenti. Le ampiezze campionarie

possono essere differenti.

Assunzioni:

Campioni di taglia n e m sono casuali

• La variabile di interesse è continua non distribuita

• normalmente

Attribuzione dei ranghi

• Calcolo della somma dei ranghi del campione (T) di

• numerosità inferiore (n)

- se n>8 è possibili approssimare la distribuzione dei ranghi

alla distribuzione normale 24

- se n≤8 si confronta T con la tavola dei ranghi

Wilcoxon per dati appaiati

Tecnica non parametrica per confrontare due campioni appaiati

Assunzioni:

Campione casuale semplice di taglia n≤40; può essere applicato solo quando ogni soggetto ha 2 valori

• Le misurazioni devono essere in scala numerica continua o numerica discreta (conteggi)

• Attribuzione ranghi alle differenze calcolate (in valore assoluto --> non vede se uno è maggiore o minore

• dell’altro, ma che c’è differenza) tra i valori di prima e dopo; quando la differenza è zero si scarta la coppia -->

Wilcoxon lavora sulla posizione dei dati che mostrano una differenza; può essere un problema scartare gli zeri!

Gli zeri significano che il trattamento non ha avuto effetto, sono dati importanti (problema di questo test)

Attribuzione segno ai ranghi

• Calcolo della somma dei ranghi (W)

• Se n>20 la distribuzione di W approssima la normale; se n≤20 tabella di distribuzione di Wilcoxon

•

Kruskal-Wallis

Tecnica non parametrica per confrontare 3 o più campioni indipendenti; le ampiezze campionarie possono essere

differenti.

Assunzioni:

campioni casuali semplici

• attribuzione del rango indipendentemente dal gruppo di appartenenza

• calcolo di H (formula di Kruskal-Wallis)

• 2

il valore critico è riferito alla distribuzione con gradi di libertà = nr gruppi – 1

• se abbiamo solo 3 campioni, allora dobbiamo avere a disposizione almeno 5 osservazioni in ogni campione

• 25

Svantaggi dei test non parametrici:

sia il test Mann-Whitney che Kruskall-Wallis utilizzano solo una piccola parte delle informazioni disponibili,

praticamente il numero di osservazioni al di sopra e al di sotto delle mediane --> utilizzano i ranghi: non so nulla

sulla dispersione

nel test di Wilcoxon due tipi di inconvenienti:

- nessuna variazione --> nessuna informazione

- i valori assoluti possono essere identici in due o più osservazioni 16-03-17

(lezione 6)

Test non parametrici – variabili qualitative

e analisi delle frequenze

Test del chi-quadro

proprietà: lavora solo con frequenze variabili in scala nominale-ordinale

- 2

tipi di test del : test di bontà dell’adattamento, test di indipendenza, test di omogeneità

- 2

filosofia del : confronto tra osservate e attese

- statistica del test: ------------------------------------------

- regola di decisione:

- : c’è bontà di adattamento, c’è indipendenza,

H

c’è omogeneità. Se p-value <α, rifiuto H

2 sulla bontà di adattamento

Test χ

H : c’è bontà di adattamento

Verificare se un campione di valori osservati di una variabile casuale è compatibile con l’ipotesi che è stato estratto da una

popolazione: distribuita normalmente

con distribuzione binomiale

In questo caso spero che H sia vera (cioè che i dati provengano da una popolazione distribuita normalmente).

Se p> 0.05 H è vera

Se p< 0.05 H non è vera: il parametro è distribuito in modo asimmetrico

Test per l’indipendenza

H : tra le variabili c’è totale indipendenza

Caratteristiche: 2

ogni versione del test del permette di confrontare le frequenze osservate e attese sotto qualche ipotesi nulla

• gli elementi che sono conteggiati devono essere assegnati a categorie nominali

• le ipotesi di conclusione sono stabilite in termini di indipendenza tra le due variabili

• i gradi di libertà sono (r-1)*(c-1) --> riferiti al numero di righe (r) e di colonne (c), non alla numerosità del campione

• la V di Cramer fornisce la misura intuitiva della dimensione dell’effetto

• 2

Limiti del :

χ se la tabella ha 1 grado di libertà è obbligatorio fare la Correzione di Yates per la continuità

se in una cella ci sono meno di 5 elementi, non è attendibile, quindi si usa un test di Fisher se la tabella è 2x2,

mentre negli altri casi bisogna accorpare le categorie (riduzione possibilità di scelta e perdita di

informazioni)

(χ è a 2 code, mentre Fisher a 1 coda: sono diversi e uno è maggiore o minore dell’altro)

Esempio di test del per l’indipendenza:

Studio sulla correlazione tra assunzione di acido folico in

gravidanza e riduzione del rischio di difetti del tubo neurale

(spina bifida, anencefalia) --> notata differenza di assunzione per

etnia. Chieste informazioni a 693 donne gravide sul loro uso di

acido folico per determinare se l’uso preconcezionale di acido

folico e l’etnia fossero indipendenti. 26

Esercizi

1. Il numero medio di tentativi per superare una prova di abilità logiche in una popolazione in condizioni normali è = 13.4

con = 1.2. Qual è la probabilità di trovare persone in questa popolazione che impiegano un numero di tentativi uguali o

superiori a 16?

2. In una popolazione sana il livello medio serico di protrombina è = 20.0 mg/100 ml e la deviazione standard = 4

µ σ

mg/100 ml. Un campione di 40 pazienti affetti da carenza di vitamina K ha un livello medio campionario di protrombina di

18.5 mg/100 mL. è possibile concludere che la carenza di vitamina K altera il livello di protrombina?

3. Un protocollo su due farmaci ipoglicemizzanti ha come obiettivo verificare l'efficacia e l'azione dei due farmaci.

4. In uno studio su pazienti oncologici si vuole la riduzione della massa tumorale e l'impatto di 3 farmaci sui marker.

Regole per il :

Obiettivo: verificare se esiste una differenza significativa tra la frequenza di variabili in scala nominale.

Gli elementi che sono conteggiati devono essere assegnati a categorie nominali

Ogni cella deve avere almeno 5 elementi; se la tabella è 2x2 possiamo usare il test di Fisher, in tabelle più grandi

dobbiamo accorpare le categorie 2

La correzione di Yates nel si applica solo quando abbiamo 1 grado di libertà

Questionario di autovalutazione:

1) Quale potrebbe essere il principale obiettivo dei metodi inferenziali?

A) Non esiste un obiettivo principale, le analisi inferenziali vanno effettuate solo quando si è certi che il risultato

presenterà una significatività della differenza studiata

B) Dare più rilevanza allo studio

C) Calcolare il valore del p-value senza il quale è decisamente difficile pubblicare un lavoro su una rivista scientifica

D) Sintetizzare la differenza in studio tenendo conto contemporaneamente di tutti i parametri necessari e valutarne

la probabilità che essa possa essere dovuta al caso

2) Quale metodo andrebbe utilizzato per confrontare due medie calcolate su due gruppi, con deviazioni standard

significativamente diverse tra loro?

A) t-Student per dati appaiati

B) t-Student per dati indipendenti con varianza pooled

C) t-Student per dati indipendenti senza varianza pooled

D) Test F

3) Un gruppo di ricercatori ha voluto confrontare i livelli medi di colesterolo rilevati su 5 gruppi di persone che

seguivano diete diverse tra loro. Allo scopo è stato utilizzato il Test t-Student per dati indipendenti applicato a tutti i

gruppi presi a coppie, evidenziando tra il gruppo 1 e il gruppo 3 una differenza con un p-value 0.03. Cosa pensate di

questo risultato?

A) Il test utilizzato è corretto e il p-value è abbondantemente al di sotto del valore soglia del 5%, quindi si può

rifiutare l'ipotesi 110 e sostenere la differenza tra i due gruppi

B) Il test utilizzato non è corretto anche se un p-value così basso evidenzia ugualmente una differenza significativa

C) Il test utilizzato non è propriamente quello corretto e soprattutto il p-value può essere preso in considerazione

solamente dopo una adeguata correzione

D) II test utilizzato non è corretto e quindi anche il p-value ottenuto è totalmente inutilizzabile per trarre qualche

conclusione

4) In uno trial clinico, un campione di 90 pazienti è stato suddiviso in modo casuale (random) in 2 gruppi: uno verrà

sottoposto ad un nuovo trattamento T1 (n1=40), l'altro ad un trattamento già esistente T2 (n2=50). Dopo uno stesso

periodo di tempo, nei due gruppi sono stati definiti migliorati rispettivamente 8 e 14 pazienti. Se non ci fosse

nessuna differenza tra i due trattamenti, quanti migliorati avremmo potuto aspettarci trattati con T1?

A) Lo stesso numero di quanti se ne sono osservati

B) Quasi 16

C) Quasi 11

D) Quasi 10

5) La correzione di Yates nel test del chi-quadrp si applica :

A) sempre

B) quando abbiamo una tabella 2 per 2

C) quando la variabile è in scala numerica continua

D) Nessuna delle precedenti

6) L'ANOVA si può applicare se:

A) i gruppi sono indipendenti

B) i campioni sono equinumerici

C) le popolazione da cui i campioni sono stati tratti non sono distribuiti normalmente

D) nessuno dei precedenti

7) Il test di Bonferroni si usa con:

A) test t di Student

B) test del chi-quadrato

C) ANOVA

D) Tutte le precedenti

Soluzioni: 1 , 2 , 3 , 4 , 5B, 6A, 7

CORRELAZIONE

Relazione che esiste tra le variabili; parametri che vengono influenzati da altri parametri.

Regressione lineare semplice

Forma della relazione:<

Anteprima

Vedrai una selezione di 10 pagine su 43