STATISTICA
Insieme di metodi di natura logica e matematica atti a raccogliere, elaborare, S descrittiva
analizzare e interpretare i dati quantificabili ottenuti da indagini/esperimenti Insieme di tecniche utili per descrivere quanto
osservato
Nasce da una domanda di ricerca, cioè qualcosa che permette di pianificare → Obiettivo riassumere i dati sanitari raccolti
un’indagine, un esperimento che comprenda molte persone – informazioni a calcolando le opportune statistiche descrittive
causa della variabilità dei fenomeni (entro lo stesso soggetto e tra soggetti) e/o indicatori che in modo sintetico descrivano
il fenomeno studiato
S inferenziale
Insieme di tecniche utili per trarre conclusioni
da quanto osservato o prendere decisioni in
condizione di incertezza
→ Obiettivo quello di dedurre o predire i
parametri della popolazione dalle osservazioni
campionarie
ELEMENTI
POPOLAZIONE
Insieme di tutti i possibili elementi, unità, individui che sono oggetto della ricerca
Parametro caratteristica costante della popolazione che, in genere, è ignota
→ Sono anche detti costanti o valori veri per distinguerli dai valori campionari che sono invece variabili
Statistica campionaria
Statistica calcolata sui dati campionari per stimare il parametro ignoto della popolazione
Presenta comunque incertezza a causa dell’errore del campionario
La precisione della stima fornita dal campione è maggiore con u fenomeno con poca variabilità nella popolazione e con
maggiore dimensione del campione
CAMPIONE
Sottoinsieme finito di unità estratte dalla popolazione sul quale si osservano le variabili di interesse
→ usato perché non è possibile studiare l’intera popolazione che interessa, non è conoscibile in modo esaustivo neppure
virtualmente
→ la selezione del campione deve essere indipendente dal fenomeno oggetto di studio: lo è se obbedisce a leggi
probabilistiche, deve essere estratto casualmente
Su esso si misura-valuta la caratteristica di interesse, la variabilità → ogni misurazione viene detta osservazione e da essa
si traggono delle conclusioni, l’inferenza statistica, sulle caratteristiche dell’intera popolazione a cui si è interessati
→ per questo il campione è rappresentativo della popolazione di riferimento: i risultati campionari non interessano di per sé ma
solo perché consentono di trarre conclusioni generali valide per tutta la popolazione da cui il campione è stato estratto
CAMPIONAMENTO
La popolazione deve essere numerabile, ogni membro della popolazione può essere identificato
Casuale semplice Ogni unità della popolazione ha la stessa probabilità di entrare a far parte del campione
Sistematico Il primo soggetto del campione è estratto in maniera casuale e quindi ogni n-esimo paziente viene scelto
Stratificato Esistono sottogruppi di cui si vuole tener conto quindi si divide la popolazione in stati seleziono un
campione all’interno di ogni strato
RACCOLTA DATI
Le singole unità costituiscono le osservazioni o unità statistiche da cui verranno studiate le caratteristiche di interesse
- Sociodemografiche età, genere, istruzione…
- Antropometriche: peso, altezza, circonferenza fianchi, lunghezza del femore del nascituro…
- Biologiche: frequenza cardiaca, valori dei trigliceridi, la velocità di replicazione di cellule maligne…
- Abitudini dieta, attività fisica, abitudine al fumo, uso di farmaci…
- Opinioni/giudizi/atteggiamenti attenzione ai temi della salute, atteggiamento verso l’AIDS…
- Scale di dolore PIPP, MOPS, VAS
Variabile indica una caratteristica di interesse che in
momenti diversi può assumere valori o modalità diverse,
sia in uno stesso soggetto sia tra soggetti diversi
Si esprime attraverso una scala di misura, un sistema di
riferimento in cui le determinazioni della variabile
assumono significato
V QUALITATIVA
Quando assuma modalità non numeriche
Categorica – nominale solo confronti del tipo uguale o diverso
Ordinale le modalità hanno una gerarchia
V QUANTITATIVA
Quando assuma valori numerici
Continua assuma valori continui in un intervallo
Discreta assuma valori distinti numerabili, dato da numeri interi
COME OTTENERE LE INFORMAZIONI
- Somministrazioni di un appositamente costruito → richiede competenze che garantiscano la creazione di
questionario un questionario esauriente ma di facile compilazione
- dei dati necessari da cartelle cliniche, schede di dimissione
Estrazione
ospedaliere, certificati di nascita-morte, archivi delle ASL - medici di L'utilizzo di dati raccolti da altri
base – assicurazioni → richiede spirito critico per poterne
- Tramite di dati già pubblicati: riviste scientifiche,
consultazione valutare l’attendibilità
pubblicazioni ISTAT
STRUMENTI
TABELLE
VARIABILE QUALITATIVA NOMINALE
Frequenza assoluta
Il numero di unità che presentano una determinata modalità del carattere di interesse
→ sommando le varie frequenze si ottiene il num totale di soggetti
Frequenza relativa
È il rapporto tra la frequenza assoluta delle unità che presentano una determinata
modalità e il totale delle unità → la somma delle varie frequenze è 1 e moltiplicando il
risultato per 100 si ottiene la percentuale
Le modalità si possono elencare in ordine alfabetico facilita la ricerca della modalità, in ordine crescente rispetto alla frequenza
facilita l’individuazione delle modalità in base alla loro frequenza, raggruppate riduce il numero di modalità
VAR QUALITATIVA ORDINALE o QUANTITATIVA
Vi è gradazione tra le classi ma non è possibile quantificare le differenze di intensità
Intensità del dolore
È data una scala di intensità nulla < lieve < moderata < forte
e si assegna un punteggio a ogni livello → il punteggio è Scale visuo-analogiche
un’etichetta, un modo per ordinare, non ha valore quantitativo
Frequenza assoluta cumulata
Indica il numero delle unità che presentano un valore della variabile
minore o uguale alla modalità in questione
→ la frequenza assoluta cumulata corrispondente all’ultima modalità
coincide con la somma di tutte le freq, cioè con il totale delle
osservazioni
Frequenza relativa cumulata
Indica la frequenza relativa delle unità che presentano un valore della
variabile minore o uguale alla modalità in questione
Classi di frequenza dato un carattere quantitativo è possibile determinare classi equampie – equifrequenti → i valori
devono avere collocazione univoca nelle classi
GRAFICI
DIAGRAMMA CIRCOLARE – A TORTA
Permette di visualizzare le relazioni di forza tra le modalità del carattere → var qualitative
Per calcolare l’angolo di ogni spicchio si moltiplica la frequenza relativa per 360
DIAGRAMMA A BARRE
ORIZZONTALI VERTICALI
Var qualitative nominali Var qualitative ordinali e quantitative discrete
Asse X: significato quantitativo Asse X: no significato quantitativo
Asse Y: no significato quantitativo Asse Y: significato quantitativo
ISTOGRAMMA A CANNE D’ORGANO
Var quantitative continue
Le barre non sono distanziate e non hanno necessariamente basi uguali (classi non della stessa
ampiezza)
L’area di ogni barra è proporzionale alla frequenza della modalità a cui si riferisce
→ l’altezza Y è proporzionale al rapporto tra la frequenza e l’ampiezza della classe
(h=f/A)
Se le classi hanno uguale ampiezza, l’altezza è proporzionale alla frequenza
Dal poligono di frequenza di arriva alla curva di frequenza
OGIVA DI GALTON
Var quantitative continue
Rappresenta la frequenza cumulata di una serie di dati raggruppati in classi
→ per ciascun valore o per ciascun estremo di classe, indica quante osservazioni sono ≤ a quel valore
CARTOGRAMMA
Rappresentazioni grafiche che consentono di osservare la distribuzione delle frequenze in un territorio geografico
Costruiti applicando, su una mappa, simboli o colorazioni diverse che indicano una particolare classe di frequenza
DIAGRAMMA A PUNTI – SCATTER PLOT
È un grafico cartesiano che rappresenta la relazione tra due variabili quantitative: ogni punto
del diagramma corrisponde a una coppia di valori
DISTRIBUZIONE DI FREQUENZA ASIMMETRICA
SIMMETRICA NEGATIVA POSITIVA
UNIMODALE BIMODALE
TEST DIAGNOSTICO
Qualunque procedimento utile all’identificazione di uno stato di malattia
+
Esito positivo T induce a sospettare la presenza della malattia
-
Esito negativo T se induce a escludere la presenza della malattia Prevalenza di malattia rapporto tra numero dei malati e totale
VALUTAZIONI dei soggetti
Condotte sul test utilizzano la stima di: + +
Sensibilità Se veri positivi VP / malati → è la probabilità che ha un test di dare esiti positivi T considerando i malati M
- -
Specificità Sp veri negativi VN / sani → è la probabilità che ha un test di dare esiti negativi T considerando i sani M
→ sono caratteristiche interne e proprie: sono misurabili sperimentalmente, comprese tra 0 e 1 (o tra 0% e 100%) e
generalmente non sono contemporaneamente =1
Condotte sui pazienti utilizzando la stima di: + +
Valore predittivo positivo VPP VP / positivi → probabilità che sia malato M un soggetto con esito positivo T
- -
Valore predittivo negativo VPN VN / negativi → probabilità che sia sano M un soggetto con esito negativo T
→ a parità di Se e Sp: al diminuire della prevalenza di malattia diminuisce il VPP e aumenta il VPN
CONSIDERAZIONI
Se la prevalenza di malattia è molto bassa, il VPP è lontano da 1 anche se Se e Sp sono molto elevate → in uno screening
della popolazione generale è inevitabile che molti soggetti con risultato positivo in realtà siano falsi positivi
Se il fine è individuare il maggior numero di malati, il test migliore è quello con sensibilità maggiore
Se il fine è escludere i soggetti sani, il test migliore è quello con specificità maggiore
al crescere della sensibilità tendono al numero totale dei malati
VP tendono al numero totale dei soggetti sani al crescere della specificità
VN cresce al crescere della prevalenza della malattia
VPP cresce al diminuire della prevalenza della malattia
VPN
MISURE DI
POSIZIONE
Indici di posizione numeri rappresentativi dei dati: danno indicazioni sull’ordine di grandezza (misura della tendenza centrale)
MEDIA
È data dalla →
somma dei valori rilevati divisa per il numero di osservazioni, media aritmetica dei valori Dati quantitativi
- È il baricentro della distribuzione: la somma delle differenze tra i valori e la loro media aritmetica è 0
- Può essere un valore che non risulta nell’insieme di dati di studio
- È considerata la migliore e più comune misura di tendenza centrale perché tiene conto del valore di tutti i dati
→ media ponderata – pesata somma dei valori moltiplicati per la loro frequenza diviso la somma delle frequenze
MEDIANA
È il valore della variabile tale per cui l’insieme delle osservazioni è per metà inferiore e per metà superiore ad essa
È il valore con nella sequenza ordinata, valore al di sopra del quale si trova il 50% delle osservazioni
posizione intermedia
- Rispetto alla media aritmetica è meno sensibile ai valori estremi delle osservazioni: non è influenzata dai valori estremi
e se i valori sono molto concentrati in gruppi separati non è utile
- Per calcolarla bisogna ordinare le osservazioni
- Per n dispari, la mediana occupa la posizione ( n + 1) / 2
- Per n pari, la mediana è il valore centrale tra n / 2 e n / 2 +1
→ quantile – percentili – centili è quel valore della variabile per cui il p% delle osservazioni assuma valori <x e 1-p%
p
assume valori ≥x p
→ quartile dato da 3 valori che ripartiscono una popolazione in 4 parti uguali: il
secondo quartile è la mediana
MODA
Corrisponde alla modalità o → unica misura per dati qualitativi nominali
valore che si presenta con la maggior frequenza
- Distribuzione unimodale vi è solo un valore modale bimodale vi sono due valori modali multimodale più valori modali
- È una buona misura di sintesi quando vi è un solo valore con frequenza molto superiore alle altre
DISPERSIONE
Numeri che forniscono informazioni sulla variabilità (eterogeneità) del fenomeno in studio
DEFINIZIONE SVANTAGGI
VANTAGGI
differenza tra il valore più grande max e Comprende tutti i Molto influenzato dai valori estremi
RANGE quello più piccolo min della distribuzione valori
Misura quanto un valore è distante dalla Adatta a
media aritmetica manipolazioni Non adatta per distribuzioni non
DEVIAZIONE STANDARD positive – negative in base a dove cade statistiche simmetriche
rispetto alla media
Differenza tra il terzo e il primo quartile: è Validi anche per
QUANTILI l’ampiezza dei valori che contiene la metà distribuzioni non Non adatti a manipolazioni statistiche
Intervallo interquartile centrale dei valori osservati simmetriche
Varianza data dalla somma delle singole variabilità elevate alla seconda divisa per la numerosità
Deviazione standard si ottiene dalla radice quadrata della varianza
COEFFICIENTE DI VARIAZIONE
Rapporto tra la deviazione standard e la media
- Utile per confrontare la variabilità di campioni con due medie molto diverse o per
confrontare due variabili espresse in unità di misura diverse
- Indica la misura della variabilità per ogni 100 unità di media aritmetica
ASSOCIAZIONE
Correlazione relazione lineare tra due variabili: a ogni valore della prima corrisponde un valore della seconda
→ dall’analisi grafica scatter point si può avere idea dell’entità e del verso della relazione tra le due variabili r il suo segno
indica il verso
Correlazione diretta – positiva cambiando il senso di una variabile, l’altra varia della relazione
nello stesso senso (dipende dalla
Correlazione indiretta – inversa cambiando il senso di una variabile, l’altra varia in covarianza)
senso opposto
→ 1 r 1
Perfetta correlazione alla variazione di
una variabile corrisponde una variazione
rigidamente dipendente dall'altra
Assenza di correlazione variando una
variabile l'altra non varia o varia in modo
del tutto indipendente
MISURE DI FREQUENZA DI MALATTIA
PROPORZIONE
È una frazione in cui il numeratore è compreso nel denominatore
Indica la relazione quantitativa fra una parte e il tutto: esprime una grandezza relativa, sono adimensionali, variano tra 0 e 1 e
stimano la probabilità che l’evento considerato si verifichi
TASSO
Misura il cambiamento istantaneo di una quantità per la variazione unitaria di un’altra quantità che in genere è il tempo
È costituito da un numeratore, un denominatore e un periodo di tempo di riferimento
POPOLAZIONE A RISCHIO
È data dalla parte della popolazione suscettibile alla malattia, ovvero gli individui
liberi dalla malattia e a rischio di contrarla
Dall’osservazione della popolazione a rischio per un certo periodo di te
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.