Statistica: conoscenze preliminari per l'osservazione biostatistica
Variabilità biologiche
Lo studio di una caratteristica biologica è complicato dall'impossibilità oggettiva di identificare una singola misura come valore vero del fenomeno. Alla variabilità possono contribuire molteplici fattori, quali sesso e l'età, altri meno anche se fondamentali, quali il corredo genetico, le abitudini di vita, malattie progressive o in atto, e ciascuno può contribuire a diversificare gli individui. Per quanti soggetti esaminati siano simili tra loro in relazione a detti fattori di variabilità, i valori misurati non saranno mai tutti uguali: permane una differenza naturale, biologica, non eliminabile. Il risultato di una misura in uno stesso soggetto può dipendere dal momento in cui viene rilevata e anche da dove viene rilevata la misura.
Alla variabilità contribuisce anche un'incertezza insita nell'operazione di misura, legata all'operatore, alla strumentazione e alla tecnica impiegata che, singolarmente in associazione, possono portare a valori diversi addirittura nella ripetizione di una misura su di uno stesso reperto.
Anche a parità di condizioni, permangono fattori imponderabili di variabilità: analisi di laboratorio ripetute su medesimo copione portano frequentemente a risultati non coincidenti. Possiamo quindi concludere che non esiste la certezza che il risultato di una singola misura corrisponda al valore vero di ciò che si desidera misurare.
Ogni fattore di variabilità può singolarmente contribuire a determinare uno scostamento del valore vero ignoto sommandosi algebricamente a quello degli altri.
La statistica assume quindi fondamentale importanza per valutare le incertezze, determinata dalla variabilità delle misure in biologia e medicina, per cui si può legittimamente parlare di biostatistica.
Variabili e costanti
Il carattere misurato viene genericamente definito variabile, ed è comune il ricorso al simbolismo matematico indicando le variabili con una delle lettere x, y, t o z. Ciò permette di esprimere in modo razionale le relazioni tra grandezze che possono assumere valori diversi. Si distinguono quindi variabili dipendenti e variabili indipendenti. Quando in una forma compaiono valori numerici, questi si definiscono costanti e vengono convenzionalmente indicati con la lettera dell'alfabeto a, b, c. Spesso si incontrano costanti che possono assumere valori diversi a seconda delle condizioni operative, per cui si definiscono costanti specifiche.
Una variabile può assumere teoricamente qualsiasi valore, positivo o negativo, soprattutto in riferimento a microbiologiche, alcuni valori risultano impossibili nella realtà o non compatibili con la vita. Per questo motivo, occorre evidenziare i limiti entro i quali la variabile viene considerata. Non sono concepibili valori negativi per una componente del sangue o per la temperatura corporea. Tale intervallo di variabilità o campo di esistenza o range viene definito dominio, se riguarda una variabile indipendente, e codominio, quando è riferito a una variabile dipendente.
Nel caso di misure numeriche, una variabile risulta continua o discreta in relazione alla possibilità di assumere o meno valori intermedi tra due unità consecutive. Tuttavia, la variabile è continua in quanto teoricamente potrebbe assumere tutti valori intermedi anche con un numero infinito di cifre decimali. Il concetto di variabile è frequentemente esteso ad aspetti quali situazioni o giudizi di tipo stato civile, sesso, situazione patologica, le cui modalità di presentazione non sono quantitative. In questi casi si dovrebbe più correttamente parlare di mutabili.
Concetto di misura e classificazioni del carattere statistico delle osservazioni
Una misura è il risultato delle procedure che permettono di identificare un oggetto con un valore numerico o con un attributo.
Il tipo di misura è classificato secondo diversi livelli:
- Scala nominale o categorica (misure qualitative): è il livello di classificazione in cui sono possibili solo confronti tipo: uguale o diverso (sesso, Rh+ o Rh-, stato civile...); dove le etichette sono riferibili a categorie o oggetti. La scala più semplice è costituita dalla suddivisione in due gruppi, dicotomica, oppure una suddivisione con più di due modalità, politomica.
- Scala ordinale o per ranghi (misure semiquantitative): le misurazioni si prestano a essere classificate anche in base al criterio maggiore-minore (una gerarchia, la gravità dei sintomi di una patologia,...). Sono misure semiquantitative e di conseguenza non è lecito applicare su di esse le abituali operazioni aritmetiche, mentre sono previsti invece specifiche elaborazioni statistiche. Spesso una misura ordinale in campo medico assume il significato di punteggio e diventa strumento di valutazione di una situazione e della sua evoluzione nel tempo.
- Scala quantitativa intervallare: contempla la presenza di un intervallo costante tra due consecutive unità (un grado di temperatura corporea è sempre un grado, su tutta la scala). Esiste uno zero relativo per la quale sono previsti anche valori negativi.
- Scala quantitativa di rapporto: fornisce la massima informazione. Tra due misure è possibile stabilire la diversità, quale sia la maggiore, definire la differenza e determinare quante volte una sia contenuta nell'altra. Si prevede uno zero assoluto e i valori sono solo positivi.
Uno strumento scrittivo di base: le percentuali
Frequenze assolute, relative e percentuali
Le frequenze assolute sono le misurazioni ottenute tramite conteggi. Per un miglior valore informativo, una frequenza assoluta (Fa) deve essere riferita al totale delle frequenze; si ricava così la frequenza relativa, calcolata con Fr = Fa/N dove N è il totale delle osservazioni, ed è sempre compresa tra 0 e 1.
Altre indicazioni vengono dalle frequenze relative percentualizzate o percentuali (%) comunemente usate per la presentazione dei risultati, ed è ottenuta dalla frequenza relativa moltiplicata per cento e il cui intervallo di esistenza è compreso tra 0 e 100.
Errore di misura
L'errore di misura commesso nella rivelazione di una misura può essere di tipo sistematico (inaccuratezza), da eliminare o ridurre, e di tipo casuale (imprecisione), controllabile statisticamente, ma non eliminabile. È opportuno segnalare l'entità dell'errore, che può essere espressa in forma assoluta (l'errore prevedibile) oppure in forma relativa o percentuale (l'errore assoluto rapportato alla misura). L'errore relativo permette confronti tra i rilevamenti ottenuti con unità di misura e/o con ordini di grandezza diversi.
Rapporti di composizione
Si tratta delle percentuali delle modalità o valori con cui si presenta una variabile. Come si comprende dal nome, si ottengono mettendo in relazione una parte dell'informazione con il suo totale. Il numeratore e il denominatore sono dati omogenei: il primo è una parte del secondo e la somma di tutte le percentuali deve ammontare al 100%.
Variazioni percentuali
La variazione percentuale di una misura quantitativa può essere espressa in forma relativa e/o percentuale facendo il rapporto tra la variazione e il valore iniziale. Un'elaborazione del principio di base porta una semplice formula che, mediante un indice relativo di variazione, permette di calcolare la quantità. Il risultato di più variazioni percentuali consecutive si ottiene come prodotto dei corrispondenti indici relativi di variazione.
In alternativa una variazione percentuale può essere calcolata direttamente rapportando la frequenza (o la quantità) finale a quella iniziale.
Rapporti incrementali e numeri indice
L'indice di variazione relativo viene anche utilizzato come rapporto incrementale per valutare l'evoluzione temporale di un fenomeno in relazione a vari sottoperiodi. Tali variazioni percentuali possono essere presentate anche come numeri indice usando un unico valore di riferimento, in genere uguagliato a 100.
Percentuali di percentuali
Una percentuale corrisponde a una frazione. Una percentuale di percentuale diventa una frazione di frazione, che matematicamente si risolve con il loro prodotto. Per evitare errori, è consigliabile effettuare calcoli riguardanti le percentuali usando corrispondenti valori relativi.
Uso improprio di percentuali
Occorre conoscere i criteri corretti di impiego delle percentuali per non utilizzarle impropriamente. In particolare, le percentuali sono corrette solo se derivate da valori numerici su scala di rapporto e riferiti a frequenze non troppo piccole.
Raccolta e organizzazione dei dati
Programmazione di una ricerca
Le attuali metodologie e applicazioni biostatistiche sono il risultato di una lenta evoluzione del pensiero e delle tecniche ideate per favorire la comprensione di fenomeni biologici, sanitari e sociali soggetti a variabilità.
Scopo dell'indagine è l'approfondimento delle conoscenze di un fenomeno in tempi a costi contenuti. Una prima analisi del procedimento metodologico permette di distinguere due momenti distinti: uno di logica induttiva e una di logica deduttiva.
- Logica deduttiva si ha quando si formula una teoria, quindi si cerca di verificarla coi dati.
- Logica induttiva invece partendo dai dati, si cerca di giungere alla formulazione di una legge o di una regola.
Una ricerca completa è la risultante di un'alternanza tra i due momenti di procedura logica. Finalità della ricerca: i metodi statistici impiegati in un'indagine sperimentale variano a seconda delle finalità che si desiderano perseguire. Queste dipendono dagli scopi della ricerca e quindi dai quesiti che essa si pone. Attraverso i seguenti livelli:
- Livello descrittivo: consiste nella presentazione delle caratteristiche osservate su una popolazione in esame. Nel caso che l'indagine sia rivolta a un insieme di soggetti particolarmente numeroso, può essere applicata una tecnica particolare il campionamento, per semplificare il lavoro, cioè è rivolta a una parte di essi.
- Livello comparativo: rappresenta il secondo gradino di conoscenza statistica. Questo tipo di indagine permette di rispondere a domande particolari in cui viene introdotto il confronto tra valori o tra le modalità che la variabile studiata assume in diversi gruppi di soggetti o in situazioni diverse.
- Livello speculativo: partendo dalle informazioni dei precedenti livelli, approfondisce lo studio dei fenomeni.
In base alle sue finalità, una ricerca si potrebbe anche articolare in studi osservazionali e studi sperimentali.
- Studi osservazionali: si propongono di definire il quadro di una situazione esistente e, se possibile, di fornire giustificazioni a quanto riscontrato.
- Studi sperimentali: sono indirizzati, invece, a valutare su di uno o più variabili gli effetti determinati da un intervento, che in statistica viene spesso indicato con il termine generico di "trattamento".
Metodologia statistica applicata alla ricerca
Una ricerca appare valida quando è in grado di raggiungere obiettivi prefissati e, per questo, si ribadisce l'esigenza di una competenza statistica adeguata alla complessità del protocollo di ricerca. È ormai prassi consolidata, considerare inadeguati risultati di una ricerca che non si avvalgono di un corretto supporto statistico. L'insieme delle fasi operative delle tecniche statistiche impiegate in un progetto di ricerca costituisce il metodo statistico. Le conclusioni a cui si perviene attraverso l'elaborazione dei dati non sempre autorizzano a dare risposte sicure a domande specifiche; mettono, tuttavia, in condizione di chiarire determinati problemi, di sollevare nuovi quesiti ed eventualmente di verificare in modo probabilistico ipotesi o regole in grado di rappresentare fenomeni studiati, con l'obiettivo di ottenere risultati soddisfacenti, riducendo il più possibile rischio di valutazioni e interpretazioni erronee.
Pianificazione di una ricerca
Unità e popolazione statistica: l'insieme di tutti gli individui o di tutti gli elementi che hanno in comune il carattere che deve essere esaminato costituisce l'universo o popolazione statistica. I singoli elementi di tale insieme sono definiti unità statistiche e rappresentano la chiave di volta del processo di indagini in quanto deputati a fornire le indispensabili informazioni di base. L'utilizzazione di tutte le unità statistiche di una popolazione finita costituisce una scelta esaustiva e rappresenta l'ipotesi di elezione di ogni indagine. Oggetto di una ricerca diventa allora un insieme di unità statistiche non coincidente con tutti gli elementi di una popolazione, ma solo con una parte ridotta che viene definita campione. La riduzione delle unità statistiche comporta il rischio di ottenere informazioni non corrispondenti con la realtà del fenomeno nella popolazione totale, per cui deve essere effettuata secondo criteri scientifici che rientrano nella teoria della scelta campionaria. Il concetto di popolazione statistica deve essere interpretato in senso lato e raramente coincide con una popolazione anagrafica; generalmente, l'osservazione riguarda solo una parte di quest'ultima e tale parte assume il significato di popolazione statistica.
Rilevazione e raccolta dei dati
La fonte informativa dev'essere scelta secondo la logica del progetto di lavoro che può essere di vario genere. In particolare, i test psicometrici e i questionari sono diventati diffusi strumenti di rilevamento indiretto di abilità cognitive, capacità funzionali, sentimenti e stati d'animo, solitamente associati a patologie e trattamenti, non misurabili altrimenti. Si può affermare che il loro tentativo di quantificare aspetti non quantitativi. Così, un test psicometrico consiste in una procedura di rilevazione e di attribuzione che porta all'assegnazione di un punteggio finale, tale da permettere confronti tra periodi diversi o tra soggetti, secondo una particolare scala di misura.
Un questionario consiste in una serie di domande in forma scritta od orale formulate per la rilevazione e la misurazione di informazioni su comportamenti, opinioni e atteggiamenti. I questionari sono considerati un mezzo di rilevamento facilmente realizzabile. In realtà, un questionario dovrebbe essere costruito attraverso varie sperimentazioni a scopo di prevenire a una formulazione finale completa, valida e attendibile.
Il primo aspetto da affrontare e risolvere è quello relativo alla adeguatezza delle scale utilizzate, alla qualità dello strumento e delle tecniche di valutazione, per evitare errori sistematici. Nel caso di misure quantitative, anche il problema della precisione e dell'arrotondamento assume importanza per uniformare le informazioni e per la possibile propagazione degli errori nell'elaborazione dei dati. Rappresentano corrette abitudini identificare con codici numerici o alfanumerici le unità statistiche: questi codici possono infatti permettere di risalire all'informazione originale nel caso di dubbio o in fase di controllo.
Controllo dei dati
I dati raccolti costituiscono la base per l'analisi statistica e devono essere accuratamente controllati per garantire l'affidabilità dei risultati. È essenziale verificare l'accuratezza, la completezza e la coerenza dei dati prima di procedere con l'analisi.
-
Riassunto esame Microbiologia e virologia medica, Prof. Ravazzoni Roberto, libro consigliato Statistica medica, Mar…
-
Riassunto esame Antropologia medica, prof. Pizza, libro consigliato Antropologia medica saperi, pratiche e politich…
-
Riassunto esame Statistica, Prof. Rosaria Simone, libro consigliato Statistica per le decisioni , Domenico Piccolo
-
Riassunto esame Elementi di neurologia, Prof. Delle Monache Simona, libro consigliato Neurologia per le professioni…