Estratto del documento

Elementi di statistica medica

Definizione di statistica

La statistica si occupa dell’analisi quantitativa dei fenomeni collettivi allo scopo di descriverli e di individuare leggi e modelli che, classificando le loro variazioni, permettono di spiegarli e di prevederli. Scopo della statistica è rendere utilizzabili grandi quantità di informazioni, teoricamente già disponibili, ma di fatto difficilmente gestibili. Le funzioni della statistica sono essenzialmente due:

  • Funzione descrittiva: ogni comunità sente il bisogno, ai fini di documentazione, di raccogliere una serie di dati sugli usi, sui costumi, sulle problematiche e sulle attività sociali ed economiche dei suoi componenti;
  • Funzione predittiva: oltre al carattere descrittivo, un’esigenza a cui risponde la statistica è quella predittiva. La raccolta e l’elaborazione dei dati, e quindi la “fotografia” del passato e del presente, serve per prevedere i comportamenti futuri, per operare scelte, per assumere decisioni.

Tramite la statistica è possibile sostituire ad un’impressione qualitativa di un fenomeno la sua misura quantitativa.

Tipi di statistica

  • Statistica descrittiva: procedure per riassumere e presentare i dati e per descriverli attraverso strumenti matematici;
  • Statistica inferenziale: procedure per derivare dai dati già noti, con l’aiuto di modelli matematici, affermazioni più generali.

Chi usa la statistica?

  • Le scienze che studiano un aspetto di una collettività di individui (demografia, economia, sociologia...);
  • Le scienze sperimentali;
  • Le scienze sanitarie (biostatistica).

La biostatistica

La biostatistica è l’applicazione della statistica a una vasta gamma di temi in biologia. La scienza della biostatistica comprende la formulazione degli esperimenti biologici e la raccolta, analisi ed interpretazione dei risultati. Si è sviluppata a causa della diversità tra i viventi. Uno stesso carattere (macroscopico o microscopico), osservato su soggetti diversi o in tempi diversi, manifesta aspetti più o meno diversificati. Questa variabilità è detta variabilità naturale e non è eliminabile.

Cosa descrive la statistica?

  • Tutta la popolazione (statistica descrittiva). La metodologia impiegata è puramente descrittiva ed è un insieme di tecniche relative a questo tipo di indagini.
  • Un campione della popolazione (statistica inferenziale). L’inferenza statistica (o statistica inferenziale) è il procedimento per cui si inducono le caratteristiche di una popolazione dall’osservazione di una parte di essa (detta “campione”), selezionata solitamente mediante un esperimento causale (aleatorio). Nella statistica inferenziale si devono compiere tutte le operazioni di schematizzazione e di descrizione proprie della statistica descrittiva; ad essi poi vanno aggiunti i procedimenti inferenziali che consentono di passare dal campione alla popolazione.

Statistica descrittiva

Abbiamo già detto che per statistica descrittiva si intende l’insieme dei metodi per organizzare, riassumere e presentare i dati in modo informativo.

Es. 1: Il 49% degli elettori di un comune conosce il primo libro della Bibbia. La statistica 49 descrive il numero di persone che conosce il primo libro della Bibbia tra 100 intervistate.

Es. 2: In accordo ad interviste ai consumatori, le lavatrici X hanno avuto 9 guasti per 100 durante il 2001. La statistica 9 descrive il numero di guasti su 100 macchine esaminate.

Statistica inferenziale

Con statistica inferenziale facciamo riferimento a una decisione, stima, predizione o generalizzazione su di una popolazione, basata sull’analisi di un campione.

Es. 1 : I reparti ospedalieri monitorano la congruenza delle diagnosi di entrata con i percorsi diagnostici effettuati dai pazienti.

Es. 2: La direzione sanitaria di una azienda ospedaliera vuole selezionare un campione di cartelle cliniche per verificare l’accuratezza delle diagnosi in rapporto ai drg (diagnosis-related group).

Terminologia

  • Popolazione statistica: l’insieme degli elementi che si vuole considerare.
  • Unità statistica: ogni elemento della popolazione statistica.
  • Campione statistico: un sottoinsieme di unità statistiche, ottenuto dalla popolazione secondo una appropriata metodologia.
  • Variabile statistica: un qualsiasi carattere rilevato sul campione che si è interessati a valutare per poter fare delle “considerazioni” (inferenza) sulla popolazione.

Tipi di variabili

  • Per una variabile qualitativa, o attributo, la caratteristica esaminata è non numerica.
    • Esempio: sesso, colore degli occhi, religione, tipo di auto, ecc.
  • In una variabile quantitativa l’informazione è riportata in forma numerica.
    • Esempio: numero di figli, minuti da rimanere a questa lezione, ecc.

Le variabili quantitative possono essere classificate in discrete o continue:

  • Variabili discrete: possono solo assumere certi valori e tra questi valori in genere ci sono dei “gaps”.
    • Esempio: il numero di camere da letto in una casa, o il numero di martelli venduti al supermercato, ecc.
  • Variabili continue: possono assumere qualsiasi valore in uno specifico intervallo.
    • Esempio: la pressione di una gomma, il peso di un panino, l’altezza degli studenti di questo corso, ecc.

I "dati"

Nello studio della biostatistica si incontrano molti tipi di dati numerici, che si differenziano per la diversa relazione fra i valori possibili:

  • Dati nominali;
  • Dati ordinali;
  • Dati continui.

Dati nominali

Il carattere statistico che stiamo studiando assume stati discreti non ordinabili. I valori rientrano in categorie o classi non ordinate. I dati di tipo nominale possono essere:

  • Mutualmente esclusivi: un individuo, oggetto o misura è incluso in una sola categoria.
    • Esempio: maschi e femmine
  • Esaustivi: ogni individuo, oggetto o misura deve apparire in una delle categorie.
    • Esempio: una determinata statura distribuita fra maschi e femmine

Dati ordinali

Chiamiamo dati ordinali quelli il cui insieme dei valori è linearmente ordinato. Non sono possibili operazioni algebriche tra i valori assunti dalla variabile. I dati ordinali possono essere rappresentati anche da numeri, il cui valore intrinseco è però irrilevante.

Es. 1 : un esempio classico di scala ordinale (= variabile ordinale) è quello della famosa “scala Mercalli”, con cui si classificano (o almeno si classificavano) i terremoti in 12 “gradi” di pericolosità: strumentale, debole, leggero, moderato, abbastanza forte, forte, molto forte, distruttivo, rovinoso, disastroso, molto disastroso, catastrofico. Tale scala era originariamente basata sui danni causati dalla scossa sismica nell’ambiente antropico.

Es. 2: un altro esempio di dati ordinali che ci riguarda più da vicino è dato dagli indici di valutazione clinica.

Es.3 : l'indice di Apgar, prende il nome da Virginia Apgar, che lo ideò nel 1952. Esso è il risultato derivante da alcuni controlli effettuati immediatamente dopo il parto, finalizzati a valutare l'efficienza delle funzioni vitali primarie. L'indice di Apgar si basa su cinque parametri di base ai quali da un "voto" da zero a due. Il valore massimo dell'indice è quindi 10. I neonati con punteggio alla nascita inferiore a 4 sono gravemente depressi e necessitano di intervento medico immediato, quelli con punteggio fra 4 e 6 sono moderatamente "a rischio", bisognosi di assistenza, vigilanza e ripetizione del test ogni 5 minuti, i neonati con punteggio fra il 7 e il 10 sono considerati normali.

Corso di statistica medica

Docenti: Federica Turati, Francesca Bravi

Argomenti del corso

  1. Introduzione alla statistica medica: statistica descrittiva ed inferenziale, popolazione e campione, variabilità tra ed entro soggetti, parametro e stima
  2. Descrizione dei dati: tipi di variabili, distribuzioni di frequenza (grafici, tabelle, frequenze assolute, relative, cumulate), indici di posizione e di dispersione
  3. Distribuzione gaussiana
  4. Stima puntuale ed intervallare
  5. Test diagnostico
  6. Accuratezza e precisione

Introduzione

La statistica si intende l’insieme di metodi di natura logica e matematica atti ad analizzare e interpretare i risultati (dati) ottenuti tramite un’indagine o un esperimento. Con il termine statistica, nel linguaggio di tutti i giorni, si indicano anche semplicemente i risultati numerici (le statistiche richiamate nei telegiornali, ad esempio: l’inflazione, il PIL, etc.) di un processo di sintesi dei dati osservati.

La statistica può essere distinta in:

  • Statistica descrittiva: comprende una serie di tecniche per descrivere quanto osservato e riassumere un insieme di dati in maniera ordinata. L’obiettivo è quello di riassumere i dati sanitari raccolti calcolando le opportune statistiche descrittive e/o gli indicatori che in modo sintetico descrivano il fenomeno studiato (tabelle, grafici);
  • Statistica inferenziale: comprende una serie di tecniche per generalizzare i risultati ottenuti da un insieme campione alla popolazione dal quale esso è stato estratto. L’obiettivo è quello di dedurre o predire i parametri della popolazione dalle osservazioni campionarie.

Perché effettuare un’indagine statistica

Le motivazioni che spingono ad effettuare un’indagine statistica possono essere varie e diversificate. Per esempio:

  • Descrivere un fenomeno osservato;
  • Valutare un’associazione;
  • Valutare l’efficacia di una terapia;
  • Valutare la sopravvivenza di un gruppo di pazienti.

Variabilità tra ed entro soggetti

Perché è necessario effettuare un’indagine o un esperimento? Perché è necessario intervistare più persone o avere più informazioni sullo stesso argomento?

Perché esiste la variabilità. I fenomeni biologici sono caratterizzati da variabilità sia entro lo stesso soggetto che tra soggetti diversi.

  • Se replico più volte la misura della pressione arteriosa sistolica su uno stesso soggetto potrò trovare valori diversi e le motivazioni di tale variabilità sono molteplici: variabilità nelle misurazioni, ritmi circadiani, stato emozionale del soggetto, diversa posizione (coricato o seduto) farmaci assunti, e così via (variabilità entro soggetto).
  • Le rilevazioni della pressione arteriosa sistolica in soggetti diversi possono avere valori variabili per diverse motivazioni: età, sesso, razza, stato di salute per citare solo alcuni aspetti (variabilità tra soggetti).

Popolazione e campione

Usualmente è poco pratico o impossibile ottenere informazioni su tutte le unità di una popolazione, essenzialmente per due motivi:

  1. La popolazione è troppo vasta per essere esaminata completamente: l’esame di tutti i componenti della popolazione comporterebbe tempi lunghi e conseguenti costi elevati.
  2. A volte la popolazione è solo ipotetica o virtualmente infinita: ad es. i bambini con disturbi nell’apprendimento.

Popolazione: insieme di tutti i possibili elementi, unità, individui che sono oggetto della ricerca (può essere finita o infinita)

  • Es.1 Frequenza dei battiti cardiaci nelle persone che soffrono di obesità tutte le persone obese
  • Es.2 BMI dei pazienti affetti da tumore tutti i pazienti che soffrono di tumore

Spesso non è possibile studiare l’intera popolazione che interessa lo studio. Si fa così ricorso al concetto di campione.

Campione: sottoinsieme finito di unità estratte dalla popolazione con tecniche appropriate sul quale osservo le variabili di interesse (il vero oggetto in studio)

  • Es.1 50 persone con problemi di obesità (estratte a caso dalla popolazione lombarda, maschile e femminile e per fasce di età)
  • Es.2 100 pazienti con tumore estratti a caso dai pazienti con diagnosi di tumore nei maggiori ospedali lombardi

È sul campione che misuro/valuto la caratteristica di interesse (detta variabile). Ogni misurazione del campione viene detta osservazione. In generale osservo il campione per dire qualcosa sulla popolazione.

  • Il docente interroga un campione di allievi per verificare la comprensione della classe
  • Il cuoco assaggia un campione di pasta per valutarne la cottura
  • Il farmacologo valuta la risposta ad un farmaco su un campione di pazienti

I risultati campionari non interessano di per sé ma solo perché consentono di trarre conclusioni generali valide per tutta la popolazione da cui il campione è stato estratto. Questo processo si chiama inferenza statistica. Un campione deve essere rappresentativo della popolazione di riferimento. In generale un campione è rappresentativo se viene estratto seguendo precise leggi probabilistiche, ovvero se è estratto in modo casuale dalla popolazione. In genere, quanto più numeroso è il campione tanto migliore è l’approssimazione alla popolazione. Se il campione è estratto in modo casuale e non è distorto può essere utilizzato per studiare la popolazione (fare «inferenza» dai dati del campione sul comportamento dell’intera popolazione per un determinato fattore in studio).

Parametri dell’universo e stime

Parametri: caratteristiche costanti della popolazione, in genere ignote. Sono anche detti costanti (o valori veri) per distinguerli dai valori campionari che sono invece variabili.

  • Es.1 La media (μ) delle stature di tutti i soggetti che attualmente hanno 18 anni.
  • Es.2 La proporzione (π) di ipertesi nella popolazione italiana

Statistica campionaria: statistica calcolata sui dati campionari per stimare il parametro ignoto della popolazione

  • Es.1 La media () delle stature, calcolate su un campione di soggetti estratti dalla popolazione, stima la vera media (μ) ignota di quella popolazione.
  • Es.2 La proporzione (p) di ipertesi in un campione di soggetti estratti dalla popolazione italiana stima la vera proporzione (π) ignota di ipertesi in Italia

La stima campionaria è comunque affetta da incertezza, a causa dell’errore di campionamento. La precisione della stima fornita dal campione sarà maggiore nel caso di:

  • Fenomeno con poca variabilità nella popolazione
  • Maggiore dimensione del campione

La raccolta del dato

Uno studio statistico può riguardare, ovviamente, le persone, ma anche, a seconda del campo di studio, famiglie, villaggi, cellule, molecole... Solitamente gli individui costituiscono le nostre unità di osservazione.

Variabile statistica

Dell’unità di osservazione verranno studiate una o più caratteristiche di interesse. Queste caratteristiche potrebbero essere:

  • Fattori sociodemografici (es. genere, età, istruzione...)
  • Comportamenti abituali (es. dieta, attività fisica, uso di farmaci...)
  • Opinioni/giudizi/atteggiamenti (es. attenzione ai temi della salute, atteggiamento verso l’AIDS...)
  • La velocità di replicazione di cellule maligne.

Il termine variabile indica una caratteristica che in momenti diversi nello stesso soggetto o nello stesso momento in soggetti diversi può assumere valori o modalità diversi.

Come ottenere le informazioni

La raccolta dei dati può avvenire con modalità diverse:

  1. Tramite la somministrazione di un questionario appositamente costruito;
  2. Per estrazione dei dati necessari
    • Dalle cartelle cliniche,
    • Dalle schede di dimissione degli ospedali,
    • Dai certificati di nascita e di morte,
    • Dagli archivi delle ASL o dei medici di base o delle assicurazioni,
  3. Tramite la consultazione di dati già pubblicati
    • Riviste scientifiche,
    • Dalle pubblicazioni ISTAT

La raccolta dei dati si procede dalla cartella clinica (o da altra fonte di informazione) al file strutturato ai fini della elaborazione. È importante sottolineare che l'elaborazione statistica di dati di cattiva qualità porta soltanto a cattivi risultati, indipendentemente dalla qualità dell'elaborazione stessa.

In sintesi...

Ricapitolando per punti, abbiamo appena affrontato i seguenti argomenti:

  • Statistica descrittiva vs statistica inferenziale
  • Variabilità tra soggetti vs entro soggetto
  • Popolazione e campione
  • Parametri e stime
  • Variabile e osservazione
  • Come raccogliere i dati

Caratteristiche dei dati

  • Tipo di variabile
  • Distribuzioni di frequenza

La scelta delle tecniche di elaborazione statistica è fortemente influenzata dal tipo e dalla forma della distribuzione di frequenza della/e variabile/i in studio.

Tipi di variabili

Variabile qualitativa: quando assume modalità non numeriche

  • Categorica o Nominale: solo confronti del tipo = o ≠, ad es. sesso (uomo/donna), etnia (asiatica/caucasica/...), ecc.
  • Ordinale: le modalità hanno una gerarchia, confronti del tipo = o ≠ e anche > o <, ad es. livello di istruzione (licenza elementare, ..., laurea), livello di soddisfazione (molto, ..., poco), ecc.

Variabile quantitativa: quando assume valori numerici

  • Continua: assume valori continui in un intervallo, ad es. peso e altezza di una persona, ecc.
  • Discreta: assume valori discreti numerabili, ad es. numero di medici in un reparto, ecc.

Tipi di variabili: qualche esempio

Scala delle modalità:

Qualitativa: gruppo sanguigno nominale

Qualitative: sesso nominale-dicotomica

Quantitative: età continua

Nominale: paese di provenienza nominale

Disuguaglianza: titolo di studio ordinale

Anteprima
Vedrai una selezione di 11 pagine su 47
Appunti statistica medica e epidemiologia Pag. 1 Appunti statistica medica e epidemiologia Pag. 2
Anteprima di 11 pagg. su 47.
Scarica il documento per vederlo tutto.
Appunti statistica medica e epidemiologia Pag. 6
Anteprima di 11 pagg. su 47.
Scarica il documento per vederlo tutto.
Appunti statistica medica e epidemiologia Pag. 11
Anteprima di 11 pagg. su 47.
Scarica il documento per vederlo tutto.
Appunti statistica medica e epidemiologia Pag. 16
Anteprima di 11 pagg. su 47.
Scarica il documento per vederlo tutto.
Appunti statistica medica e epidemiologia Pag. 21
Anteprima di 11 pagg. su 47.
Scarica il documento per vederlo tutto.
Appunti statistica medica e epidemiologia Pag. 26
Anteprima di 11 pagg. su 47.
Scarica il documento per vederlo tutto.
Appunti statistica medica e epidemiologia Pag. 31
Anteprima di 11 pagg. su 47.
Scarica il documento per vederlo tutto.
Appunti statistica medica e epidemiologia Pag. 36
Anteprima di 11 pagg. su 47.
Scarica il documento per vederlo tutto.
Appunti statistica medica e epidemiologia Pag. 41
Anteprima di 11 pagg. su 47.
Scarica il documento per vederlo tutto.
Appunti statistica medica e epidemiologia Pag. 46
1 su 47
D/illustrazione/soddisfatti o rimborsati
Acquista con carta o PayPal
Scarica i documenti tutte le volte che vuoi
Dettagli
SSD
Scienze mediche MED/01 Statistica medica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher andrecarbo99 di informazioni apprese con la frequenza delle lezioni di Statistica medica e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Milano o del prof La Vecchia Carlo.
Appunti correlati Invia appunti e guadagna

Domande e risposte

Hai bisogno di aiuto?
Chiedi alla community