Anteprima
Vedrai una selezione di 1 pagina su 4
Statistica e Analisi dei dati Pag. 1
1 su 4
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

Variabili e espressioni numeriche di una "caratteristica", in senso lato

Tutto ciò che può essere descritto attraverso un numero si divide in:

  • Variabili parametriche: possono assumere qualsiasi valore entro un determinato range (età, pressione media, deviazione arteriosa, peso) e sono descritte utilizzando la moda, la media e la mediana
  • Variabili non centrale: descritte tramite la mediana e il range interquartile (IQR) quando la moda, la media e la mediana non coincidono
  • Variabili dicotomiche: possono assumere solo due sole possibilità
  • Variabili categoriche: seguono un ordine o una forma di numero assoluto o percentuale e si dividono in:
    • Variabili ordinali: seguono un ordine
    • Variabili nominali: non seguono un ordine

Misure di tendenza centrale: individuano il centro della distribuzione delle frequenze

Moda: valore che ricorre con maggior frequenza

maggiore frequenza

Mediana: valore al di sotto del quale cade la metà dei dati

Media: somma dei dati / numero dei dati

Deviazione standard (DS): ​valore che, aggiunto o sottratto alla media, comprende il 68%(≈2/3) delle osservazioni

Range interquartile (IQR): valore che, aggiunto o sottratto alla mediana, comprende il 50%delle osservazioni

MISURE DI FREQUENZA

Descrivono la frequenza di un evento all’interno della popolazione. Sono delle "proporzioni" dove il numeratore è contenuto all' interno del denominatore. Sono comprese tra 0 e 1 (o tra 0% e 100%) e si dividono in:

Numero dei casi di malattia: una stima della probabilità presenti nella popolazione di essere malati e misura la popolazione in un dato periodo

Prevalenza: proporzione di un "evento" presente all’interno di una popolazione in un determinato momento in quel periodo

Numero di nuovi casi di: una stima della

probabilità malattia verificatasi durante di ammalarsi e misura la un dato intervallo di tempo proporzione di "nuovi eventi" Numero di individui a rischio Incidenza che si verificano in una di ammalarsi nella popolazione in un dato popolazione all'inizio del intervallo di tempo periodo di tempo considerato

MISURE DI ASSOCIAZIONE

Sono quelle misure che quantificano la forza nell'associazione di un fattore di rischio (es. fumo o farmaco o inquinamento) con una determinata malattia (es. tumore). La misura principale è il rischio relativo (RR) ed è il rapporto che si calcola a partire dall'incidenza cumulativa degli esposti sull'incidenza nei non esposti

RR = 1 l'esposizione non è associata alla malattia, non influenza lo sviluppo della malattia

RR > 1 l'esposizione è associata ad un maggior rischio di malattia - fattore di rischio

RR < 1 l'esposizione è associata ad un minor rischio di malattia - fattore

Il rischio assoluto (RA) fornisce una stima più chiara del rischio relativo. Inoltre, il rischio relativo può mostrare un aumento (o una riduzione) del rischio molto ampia, ma in termini assoluti questo può tradursi in una variazione molto più piccola. Anche se un rischio assoluto può essere piccolo può comunque determinare un grande impatto sulla popolazione.

L'inferenza statistica è il procedimento logico/matematico che ci permette di generalizzare i risultati di uno studio, basato su un campione più o meno ampio, ad una popolazione più ampia. Proprio perché tutti, o quasi, gli studi sono svolti su campioni, e non su tutta la popolazione, tutti i risultati hanno un certo margine di errore. I margini di errore vengono definiti "intervalli di confidenza": sono l'intervallo di valori entro i quali stà (quasi 95%) sicuramente il vero valore della popolazione generale e va sempre calcolato.

IC 95% > 1

risultati statisticamente significativiIC 95% < 1 risultati statisticamente significativiIC 95% > 1 e < 1 risultati statisticamente non significativi

PROBABILITÀ

Il concetto si riferisce proprio alla probabilità che l’incidenza osservata tra due gruppi sia dovuta al caso. Il valore di questa probabilità si indica con “p” e ci permette di sapere se questa differenza sia “significativa”, cioè “reale” e che non sia dovuta al caso

P<0.05 risultato “statisticamente significativo” – differenze “vere”

P>0.05 risultato “non statisticamente significativo” – no differenza

POTENZA STATISTICA

Se l’intervallo di confidenza è troppo largo (es. tra il 5% ed il 35%), il nostro campione era troppo piccolo (c’è un grande margine di incertezza!), ed il margine di errore è risultato troppo ampio, per cui lo studio non ha potuto darci le indicazioni che speravamo.

ed ha quindi avuto una "potenza statistica" insufficiente. Per essere utili, gli studi devono avere una potenza statistica sufficiente, per cui il campione deve essere abbastanza grande per il nostro specifico quesito. META-ANALISI è il metodo in cui vengono combinati i risultati dei vari studi, in modo da ottenere un risultato unico, che li riassume. In questo modo, ottengo in modo "artificiale" un campione più grande, che avrà quindi minori margini di incertezza e intervalli di confidenza più stretti. NUMBER NEEDED TO TREAT è il numero di persone che è necessario trattare con un farmaco, o con un altro intervento che si sta studiando, per riuscire a prevenire l'insorgenza di 1 "evento" (o "malattia") ed è equivalente all'inverso del rischio assoluto (RA). Più il NNT è basso, maggiore sarà l'efficacia del trattamento (la situazione ideale è quella in cui NNT=1).ovvero per ogni paziente trattato si ha un beneficio) NUMBER NEEDED TO HARM è il numero di persone che è necessario trattare con un farmaco, o con un altro intervento che si sta studiando, per osservare l'insorgenza di 1 evento avverso. Più il NNH è alto, più il farmaco è sicuro (occorrerà un numero più alto di persone trattate per avere un evento avverso) STANDARDIZZAZIONE DEI TASSI Metodologia per annullare l'effetto distorsivo provocato dalla diversa distribuzione dell'evento che si sta studiando nelle diverse aree che si stanno considerando.
Dettagli
Publisher
A.A. 2021-2022
4 pagine
SSD Scienze economiche e statistiche SECS-S/01 Statistica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher Lucarizzin di informazioni apprese con la frequenza delle lezioni di Statistica e Analisi dei dati e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Ferrara o del prof Flacco Maria Elena.