Estratto del documento

STATISTICA

Insieme di metodi di natura logica e matematica atti a raccogliere, elaborare, S descrittiva

analizzare e interpretare i dati quantificabili ottenuti da indagini/esperimenti Insieme di tecniche utili per descrivere quanto

osservato

Nasce da una domanda di ricerca, cioè qualcosa che permette di pianificare → Obiettivo riassumere i dati sanitari raccolti

un’indagine, un esperimento che comprenda molte persone – informazioni a calcolando le opportune statistiche descrittive

causa della variabilità dei fenomeni (entro lo stesso soggetto e tra soggetti) e/o indicatori che in modo sintetico descrivano

il fenomeno studiato

S inferenziale

Insieme di tecniche utili per trarre conclusioni

da quanto osservato o prendere decisioni in

condizione di incertezza

→ Obiettivo quello di dedurre o predire i

parametri della popolazione dalle osservazioni

campionarie

ELEMENTI

POPOLAZIONE

Insieme di tutti i possibili elementi, unità, individui che sono oggetto della ricerca

Parametro caratteristica costante della popolazione che, in genere, è ignota

→ Sono anche detti costanti o valori veri per distinguerli dai valori campionari che sono invece variabili

Statistica campionaria

Statistica calcolata sui dati campionari per stimare il parametro ignoto della popolazione

Presenta comunque incertezza a causa dell’errore del campionario

La precisione della stima fornita dal campione è maggiore con u fenomeno con poca variabilità nella popolazione e con

maggiore dimensione del campione

CAMPIONE

Sottoinsieme finito di unità estratte dalla popolazione sul quale si osservano le variabili di interesse

→ usato perché non è possibile studiare l’intera popolazione che interessa, non è conoscibile in modo esaustivo neppure

virtualmente

→ la selezione del campione deve essere indipendente dal fenomeno oggetto di studio: lo è se obbedisce a leggi

probabilistiche, deve essere estratto casualmente

Su esso si misura-valuta la caratteristica di interesse, la variabilità → ogni misurazione viene detta osservazione e da essa

si traggono delle conclusioni, l’inferenza statistica, sulle caratteristiche dell’intera popolazione a cui si è interessati

→ per questo il campione è rappresentativo della popolazione di riferimento: i risultati campionari non interessano di per sé ma

solo perché consentono di trarre conclusioni generali valide per tutta la popolazione da cui il campione è stato estratto

CAMPIONAMENTO

La popolazione deve essere numerabile, ogni membro della popolazione può essere identificato

Casuale semplice Ogni unità della popolazione ha la stessa probabilità di entrare a far parte del campione

Sistematico Il primo soggetto del campione è estratto in maniera casuale e quindi ogni n-esimo paziente viene scelto

Stratificato Esistono sottogruppi di cui si vuole tener conto quindi si divide la popolazione in stati seleziono un

campione all’interno di ogni strato

RACCOLTA DATI

Le singole unità costituiscono le osservazioni o unità statistiche da cui verranno studiate le caratteristiche di interesse

- Sociodemografiche età, genere, istruzione…

- Antropometriche: peso, altezza, circonferenza fianchi, lunghezza del femore del nascituro…

- Biologiche: frequenza cardiaca, valori dei trigliceridi, la velocità di replicazione di cellule maligne…

- Abitudini dieta, attività fisica, abitudine al fumo, uso di farmaci…

- Opinioni/giudizi/atteggiamenti attenzione ai temi della salute, atteggiamento verso l’AIDS…

- Scale di dolore PIPP, MOPS, VAS

Variabile indica una caratteristica di interesse che in

momenti diversi può assumere valori o modalità diverse,

sia in uno stesso soggetto sia tra soggetti diversi

Si esprime attraverso una scala di misura, un sistema di

riferimento in cui le determinazioni della variabile

assumono significato

V QUALITATIVA

Quando assuma modalità non numeriche

Categorica – nominale solo confronti del tipo uguale o diverso

Ordinale le modalità hanno una gerarchia

V QUANTITATIVA

Quando assuma valori numerici

Continua assuma valori continui in un intervallo

Discreta assuma valori distinti numerabili, dato da numeri interi

COME OTTENERE LE INFORMAZIONI

- Somministrazioni di un appositamente costruito → richiede competenze che garantiscano la creazione di

questionario un questionario esauriente ma di facile compilazione

- dei dati necessari da cartelle cliniche, schede di dimissione

Estrazione

ospedaliere, certificati di nascita-morte, archivi delle ASL - medici di L'utilizzo di dati raccolti da altri

base – assicurazioni → richiede spirito critico per poterne

- Tramite di dati già pubblicati: riviste scientifiche,

consultazione valutare l’attendibilità

pubblicazioni ISTAT

STRUMENTI

TABELLE

VARIABILE QUALITATIVA NOMINALE

Frequenza assoluta

Il numero di unità che presentano una determinata modalità del carattere di interesse

→ sommando le varie frequenze si ottiene il num totale di soggetti

Frequenza relativa

È il rapporto tra la frequenza assoluta delle unità che presentano una determinata

modalità e il totale delle unità → la somma delle varie frequenze è 1 e moltiplicando il

risultato per 100 si ottiene la percentuale

Le modalità si possono elencare in ordine alfabetico facilita la ricerca della modalità, in ordine crescente rispetto alla frequenza

facilita l’individuazione delle modalità in base alla loro frequenza, raggruppate riduce il numero di modalità

VAR QUALITATIVA ORDINALE o QUANTITATIVA

Vi è gradazione tra le classi ma non è possibile quantificare le differenze di intensità

Intensità del dolore

È data una scala di intensità nulla < lieve < moderata < forte

e si assegna un punteggio a ogni livello → il punteggio è Scale visuo-analogiche

un’etichetta, un modo per ordinare, non ha valore quantitativo

Frequenza assoluta cumulata

Indica il numero delle unità che presentano un valore della variabile

minore o uguale alla modalità in questione

→ la frequenza assoluta cumulata corrispondente all’ultima modalità

coincide con la somma di tutte le freq, cioè con il totale delle

osservazioni

Frequenza relativa cumulata

Indica la frequenza relativa delle unità che presentano un valore della

variabile minore o uguale alla modalità in questione

Classi di frequenza dato un carattere quantitativo è possibile determinare classi equampie – equifrequenti → i valori

devono avere collocazione univoca nelle classi

GRAFICI

DIAGRAMMA CIRCOLARE – A TORTA

Permette di visualizzare le relazioni di forza tra le modalità del carattere → var qualitative

Per calcolare l’angolo di ogni spicchio si moltiplica la frequenza relativa per 360

DIAGRAMMA A BARRE

ORIZZONTALI VERTICALI

Var qualitative nominali Var qualitative ordinali e quantitative discrete

Asse X: significato quantitativo Asse X: no significato quantitativo

Asse Y: no significato quantitativo Asse Y: significato quantitativo

ISTOGRAMMA A CANNE D’ORGANO

Var quantitative continue

Le barre non sono distanziate e non hanno necessariamente basi uguali (classi non della stessa

ampiezza)

L’area di ogni barra è proporzionale alla frequenza della modalità a cui si riferisce

→ l’altezza Y è proporzionale al rapporto tra la frequenza e l’ampiezza della classe

(h=f/A)

Se le classi hanno uguale ampiezza, l’altezza è proporzionale alla frequenza

Dal poligono di frequenza di arriva alla curva di frequenza

OGIVA DI GALTON

Var quantitative continue

Rappresenta la frequenza cumulata di una serie di dati raggruppati in classi

→ per ciascun valore o per ciascun estremo di classe, indica quante osservazioni sono ≤ a quel valore

CARTOGRAMMA

Rappresentazioni grafiche che consentono di osservare la distribuzione delle frequenze in un territorio geografico

Costruiti applicando, su una mappa, simboli o colorazioni diverse che indicano una particolare classe di frequenza

DIAGRAMMA A PUNTI – SCATTER PLOT

È un grafico cartesiano che rappresenta la relazione tra due variabili quantitative: ogni punto

del diagramma corrisponde a una coppia di valori

DISTRIBUZIONE DI FREQUENZA ASIMMETRICA

SIMMETRICA NEGATIVA POSITIVA

UNIMODALE BIMODALE

TEST DIAGNOSTICO

Qualunque procedimento utile all’identificazione di uno stato di malattia

+

Esito positivo T induce a sospettare la presenza della malattia

-

Esito negativo T se induce a escludere la presenza della malattia Prevalenza di malattia rapporto tra numero dei malati e totale

VALUTAZIONI dei soggetti

Condotte sul test utilizzano la stima di: + +

Sensibilità Se veri positivi VP / malati → è la probabilità che ha un test di dare esiti positivi T considerando i malati M

- -

Specificità Sp veri negativi VN / sani → è la probabilità che ha un test di dare esiti negativi T considerando i sani M

→ sono caratteristiche interne e proprie: sono misurabili sperimentalmente, comprese tra 0 e 1 (o tra 0% e 100%) e

generalmente non sono contemporaneamente =1

Condotte sui pazienti utilizzando la stima di: + +

Valore predittivo positivo VPP VP / positivi → probabilità che sia malato M un soggetto con esito positivo T

- -

Valore predittivo negativo VPN VN / negativi → probabilità che sia sano M un soggetto con esito negativo T

→ a parità di Se e Sp: al diminuire della prevalenza di malattia diminuisce il VPP e aumenta il VPN

CONSIDERAZIONI

Se la prevalenza di malattia è molto bassa, il VPP è lontano da 1 anche se Se e Sp sono molto elevate → in uno screening

della popolazione generale è inevitabile che molti soggetti con risultato positivo in realtà siano falsi positivi

Se il fine è individuare il maggior numero di malati, il test migliore è quello con sensibilità maggiore

Se il fine è escludere i soggetti sani, il test migliore è quello con specificità maggiore

al crescere della sensibilità tendono al numero totale dei malati

VP tendono al numero totale dei soggetti sani al crescere della specificità

VN cresce al crescere della prevalenza della malattia

VPP cresce al diminuire della prevalenza della malattia

VPN

MISURE DI

POSIZIONE

Indici di posizione numeri rappresentativi dei dati: danno indicazioni sull’ordine di grandezza (misura della tendenza centrale)

MEDIA

È data dalla →

somma dei valori rilevati divisa per il numero di osservazioni, media aritmetica dei valori Dati quantitativi

- È il baricentro della distribuzione: la somma delle differenze tra i valori e la loro media aritmetica è 0

- Può essere un valore che non risulta nell’insieme di dati di studio

- È considerata la migliore e più comune misura di tendenza centrale perché tiene conto del valore di tutti i dati

→ media ponderata – pesata somma dei valori moltiplicati per la loro frequenza diviso la somma delle frequenze

MEDIANA

È il valore della variabile tale per cui l’insieme delle osservazioni è per metà inferiore e per metà superiore ad essa

È il valore con nella sequenza ordinata, valore al di sopra del quale si trova il 50% delle osservazioni

posizione intermedia

- Rispetto alla media aritmetica è meno sensibile ai valori estremi delle osservazioni: non è influenzata dai valori estremi

e se i valori sono molto concentrati in gruppi separati non è utile

- Per calcolarla bisogna ordinare le osservazioni

- Per n dispari, la mediana occupa la posizione ( n + 1) / 2

- Per n pari, la mediana è il valore centrale tra n / 2 e n / 2 +1

→ quantile – percentili – centili è quel valore della variabile per cui il p% delle osservazioni assuma valori <x e 1-p%

p

assume valori ≥x p

→ quartile dato da 3 valori che ripartiscono una popolazione in 4 parti uguali: il

secondo quartile è la mediana

MODA

Corrisponde alla modalità o → unica misura per dati qualitativi nominali

valore che si presenta con la maggior frequenza

- Distribuzione unimodale vi è solo un valore modale bimodale vi sono due valori modali multimodale più valori modali

- È una buona misura di sintesi quando vi è un solo valore con frequenza molto superiore alle altre

DISPERSIONE

Numeri che forniscono informazioni sulla variabilità (eterogeneità) del fenomeno in studio

DEFINIZIONE SVANTAGGI

VANTAGGI

differenza tra il valore più grande max e Comprende tutti i Molto influenzato dai valori estremi

RANGE quello più piccolo min della distribuzione valori

Misura quanto un valore è distante dalla Adatta a

media aritmetica manipolazioni Non adatta per distribuzioni non

DEVIAZIONE STANDARD positive – negative in base a dove cade statistiche simmetriche

rispetto alla media

Differenza tra il terzo e il primo quartile: è Validi anche per

QUANTILI l’ampiezza dei valori che contiene la metà distribuzioni non Non adatti a manipolazioni statistiche

Intervallo interquartile centrale dei valori osservati simmetriche

Varianza data dalla somma delle singole variabilità elevate alla seconda divisa per la numerosità

Deviazione standard si ottiene dalla radice quadrata della varianza

COEFFICIENTE DI VARIAZIONE

Rapporto tra la deviazione standard e la media

- Utile per confrontare la variabilità di campioni con due medie molto diverse o per

confrontare due variabili espresse in unità di misura diverse

- Indica la misura della variabilità per ogni 100 unità di media aritmetica

ASSOCIAZIONE

Correlazione relazione lineare tra due variabili: a ogni valore della prima corrisponde un valore della seconda

→ dall’analisi grafica scatter point si può avere idea dell’entità e del verso della relazione tra le due variabili r il suo segno

indica il verso

Correlazione diretta – positiva cambiando il senso di una variabile, l’altra varia della relazione

nello stesso senso (dipende dalla

Correlazione indiretta – inversa cambiando il senso di una variabile, l’altra varia in covarianza)

senso opposto    

→ 1 r 1

Perfetta correlazione alla variazione di

una variabile corrisponde una variazione

rigidamente dipendente dall'altra

Assenza di correlazione variando una

variabile l'altra non varia o varia in modo

del tutto indipendente

MISURE DI FREQUENZA DI MALATTIA

PROPORZIONE

È una frazione in cui il numeratore è compreso nel denominatore

Indica la relazione quantitativa fra una parte e il tutto: esprime una grandezza relativa, sono adimensionali, variano tra 0 e 1 e

stimano la probabilità che l’evento considerato si verifichi

TASSO

Misura il cambiamento istantaneo di una quantità per la variazione unitaria di un’altra quantità che in genere è il tempo

È costituito da un numeratore, un denominatore e un periodo di tempo di riferimento

POPOLAZIONE A RISCHIO

È data dalla parte della popolazione suscettibile alla malattia, ovvero gli individui

liberi dalla malattia e a rischio di contrarla

Dall’osservazione della popolazione a rischio per un certo periodo di te

Anteprima
Vedrai una selezione di 6 pagine su 21
Statistica medica Pag. 1 Statistica medica Pag. 2
Anteprima di 6 pagg. su 21.
Scarica il documento per vederlo tutto.
Statistica medica Pag. 6
Anteprima di 6 pagg. su 21.
Scarica il documento per vederlo tutto.
Statistica medica Pag. 11
Anteprima di 6 pagg. su 21.
Scarica il documento per vederlo tutto.
Statistica medica Pag. 16
Anteprima di 6 pagg. su 21.
Scarica il documento per vederlo tutto.
Statistica medica Pag. 21
1 su 21
D/illustrazione/soddisfatti o rimborsati
Acquista con carta o PayPal
Scarica i documenti tutte le volte che vuoi
Dettagli
SSD
Scienze mediche MED/01 Statistica medica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher Cate-V di informazioni apprese con la frequenza delle lezioni di Statistica medica e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Bologna o del prof Negri Eva Vanna Lorenza.
Appunti correlati Invia appunti e guadagna

Domande e risposte

Hai bisogno di aiuto?
Chiedi alla community