Anteprima
Vedrai una selezione di 4 pagine su 14
Riassunto esame Statistica medica, prof. Ambrogi, libro consigliato Statistica medica per le professioni sanitarie, Lantieri, Risso Pag. 1 Riassunto esame Statistica medica, prof. Ambrogi, libro consigliato Statistica medica per le professioni sanitarie, Lantieri, Risso Pag. 2
Anteprima di 4 pagg. su 14.
Scarica il documento per vederlo tutto.
Riassunto esame Statistica medica, prof. Ambrogi, libro consigliato Statistica medica per le professioni sanitarie, Lantieri, Risso Pag. 6
Anteprima di 4 pagg. su 14.
Scarica il documento per vederlo tutto.
Riassunto esame Statistica medica, prof. Ambrogi, libro consigliato Statistica medica per le professioni sanitarie, Lantieri, Risso Pag. 11
1 su 14
D/illustrazione/soddisfatti o rimborsati
Disdici quando
vuoi
Acquista con carta
o PayPal
Scarica i documenti
tutte le volte che vuoi
Estratto del documento

Rappresentano corrette abitudini identificare con codici numerici o alfanumerici le unità statistiche:

questi codici possono infatti permettere di risalire all'informazione originale nel caso di dubbio o in

fase di controllo.!

!

Controllo dei dati!

I dati raccolti costituiscono nel loro insime i dati grezzi, il cui unico ordine precostituito in genere è

rappresentato dalla cronologia delle rilevamento. Un controllo di dati grezzi è necessario per

limitare o eliminare errori ripetuti, i quali, anche se di lieve entità possono incidere sulla stima del

fenomeno.!

L'errore commesso nelle prime fasi della ricerca influisce sulla differenza tra modello proposto e

realtà più di quanto non influiscono di errori in fase di elaborazione.!

Il controllo dei dati grezzi non può entrare nel merito della loro correttezza, la cui verifica deve

essere già stata effettuata all'atto del rilevamento, ma può evidenziare misure poco plausibili

sfuggite al rilevatore o introdotte con la trascrizione dei dati, nonché incongruenze, dati mancanti e

valori fuori norma.!

!

Organizzazione dei dati!

I dati grezzi contengono tutte le informazioni insita nelle misure, però non forniscono una buona

visione d'insieme del fenomeno; per una loro interpretazione occorre classificarli presentandoli

nella maniera più sintetica, chiara e fedele possibile.!

È importante, nella fase dell'organizzazione, evidenziare le variabili di interesse e le unità

statistiche in modo che siano facilmente intelligibili e far ricorso a una semplificazione

dell'informazione mediante codifiche.!

Classificazione e spoglio: il primo passo per l'organizzazione dei dati consiste nell'individuare

tutte le modalità che può assumere il carattere e aggregare le unità statistiche in base tali modalità

onde pervenire a prospetti e tabelle che permettono di evidenziare in modo più chiaro il quadro

delle informazioni. Una volta definite le modalità o classi di valori, il procedimento stesso: si tratta

di attribuire ciascuna misura alla propria modalità o classe e, quindi, stabilire numerosità, cioè la

frequenza f, di ciascuna. !

Viene predisposto uno schema di lavoro con tutte le modalità previste si procede allo spoglio delle

misure. Al termine dello spoglio, viene effettuato il conteggio delle frequenze di ciascuna modalità,

senza trascurare un doveroso controllo per correggere eventuali errori di attribuzione.!

Il risultato di questo procedimento costituisce una seria azione o distribuzione di frequenze che

può essere facilmente tabulata. Si tratta di un valido mezzo di informazione descrittiva perché è di

immediata comprensione, facilmente traducibile in grafici, che talvolta rappresenta la base di

partenza per una elaborazione.!

Distribuzione di frequenze in tabella a una o più entrate: nella ricerca vengono rilevati su

ciascuna unità statistica più variabili misurate anche su scale diverse. !

Le tabelle più semplici sono riferiti a una sola variabile vengono definite tabelle a una entrata.

Questo tipo di tabella potrebbe essere indifferentemente attribuita a dati nominali presentati in

modo codificato, a dati ordinari espressi da punteggi o a dati quantitativi discreti.!

In base al numero delle variabili, si possono organizzare tabelle a due o più entrate a carattere

qualitativo, semiquantitativo, quantitativo o misto, a seconda del tipo delle variabili considerate.!

Da uno stesso insieme di dati grezzi, considerando un numero crescente di variabili, possiamo

creare tabelle a una, due ed eventualmente a tre o più entrate. !

Lara presentazione dati in tabelle a più di due entrate possibile solo entro certi limiti essendo

tabelle di difficile presentazione.!

Distribuzioni in classi: quando una variabile quantitativa a carattere continuo, una distribuzione di

frequenze può essere troppo dispersiva e quindi di poco significato.!

Si riduce il numero delle modalità assunte dalla variabile suddividendo l'intervallo di variazione in

intervalli più piccoli, o classi di frequenza, in ciascuno dei quali si raccolgono tutte le misure che

cadono al suo interno. I dati così organizzati costituiscono una particolare distribuzione di

frequenze definita distribuzione in classi.!

L'organizzazione della tabella segue il criterio generale visto in precedenza: durante lo spoglio i

valori rilevati sulle unità statistiche vengono attribuiti alla classe di pertinenza in relazione ai valori

minimo e massimo caratterizzanti ciascuna classe, definiti limiti di classe; per esempio, in

distribuzione del peso di femmine adulte, i limiti che determinano le classi vanno da 40 a 44, da 45

a 49, da 50 a 54 e così via. Ciascuna coppia di limiti, quale 45-49, costituisce l'intervallo della

classe, con il valore 45 come limite inferiore e il 49 come limite superiore.!

Talvolta, una o entrambe le classi estreme possono essere tabulati senza un limite, in questo caso

si parla di classi aperte. L'impiego di classe aperte trova giustificazione quando la presenza di

valori bassi e/o alti molto dispersi comporterebbe la necessità di presentare classe a frequenza

zero alternate a classi con pochi valori e, quando esiste la possibilità di riscontrare valori piuttosto

rari, per i quali è superfluo prevedere classi, dato il loro scarso significato. !

In una distribuzione in classi occorre tener conto di ciò introducendo i cosiddetti limiti veri o

confini di classe, rappresentati dal minimo e dal massimo valore teorico che, in base alla

precisione o all'arrotondamento della misura, possono rientrare nella classe. Un confine di classe

si deve localizzare a mezza via tra il diabete superiore di una classe il limite inferiore della

successiva, per cui si ricava come si mi somma di questi due limiti (44 + 45)/2 = 44,5 e,

chiaramente, appartiene entrambe le due classi contigue.!

La differenza tra i confini di una classe costituisce l'ampiezza della classe. La soluzione migliore

prevede classi di uguale ampiezza, soprattutto in previsione di elaborazioni successive e di un

eventuale presentazione grafica. !

Il valore centrale della classe si ottiene dalla sinistra ma dei confini della classe: per la seconda

classe, il valore risulta Xc = (44,5 + 49,5)/2 = 47. Questi calcoli, non sono possibili in caso di classi

aperte in quanto non si conoscono esattamente valori estremi.!

L'organizzazione di una divisione in classi comporta una perdita di informazione in quanto le

singole misure abbandonano il loro valore per assumere quello "rappresentativo di classe", cioè il

valore centrale.!

Le frequenze delle classi possono essere presentati come assolute, relative o percentuali per

dare l'indicazione della rappresentatività di ciascuna. !

Un utile modo supplementare di presentare le frequenze in tabella consiste nell'esprimere come

frequenze cumulate, ascendenti o retrocumulate, discendenti. Il primo caso viene indicata la

frequenza complessiva fino a quella classe inclusa, per cui con l'ultima compare il totale delle

frequenze; nella retrocumulata, il procedimento si effettua a partire dall'ultima classe, per cui il

totale delle frequenze figura nella prima classe.!

L'organizzazione di una distribuzione di frequenze è un'operazione per la quale non è prevista "la

soluzione" giusta; infatti, gli stessi dati possono dare origine più soluzioni.!

Occorre tener presente che la finalità di una distribuzione in classi è di evidenziare in tabelle

numeriche, e corrispondenti rappresentazioni grafiche, le caratteristiche dell'insieme dei dati, nel

limite del possibile, fa risaltare come si distribuiscono e dove si concentrano.!

Il numero delle classi è legato all’intervallo di variazione delle misure e all’ampiezza prescelta. La

distribuzione deve ricoprire il campo di variabilità per comprendere tutti i valori osservati.!

La scelta della ampiezza delle classi deve essere adeguata al fenomeno osservato, ma, salvo

controindicazioni specifiche, conviene adottare ampiezze di facile manipolazione.!

E’ buona norma, nella scelta dell’ampiezza, evitare la presenza di classi vuote, a frequenza zero,

situazione che si verifica quando l’intervallo di variazione è molto ampio con pochi valori sparsi. !

Quando una organizzazione in classi è poco significativa, nulla vieta che, per una migliore

comprensione dell’insieme, gli stessi dati possano essere espressi con una distribuzione a numero

inferiore di classi semplicemente accorpandole tra loro, generalmente due a due.!

Serie e seriazioni: le tabelle sinottiche viste in precedenza si possono definire serie statistica, se

le misure hanno carattere qualitativo o semiquantitativo, e seriazione statistica, se le misure

hanno carattere quantitativo. !

Talvolta, i rilevamenti effettuati si prestano a essere organizzati in distribuzioni che, in luogo delle

frequenze di una classe, presentano la misura del fenomeno. Vengono classificate in serie

temporali o cronologiche, serie cicliche e serie spaziali.!

Serie temporali: sono così definite per la caratteristica di classificare i fenomeni in relazione alla

variabile tempo. I tempi di rilevamento sostituiscono le classi e le misure e le frequenze.!

Serie cicliche: il ricercatore in campo medico valuta alcuni fenomeni che manifestano la loro

caratteristica nella ripetitività in relazione a definiti periodi di tempo. Per tali manifestazioni, è

prevista la creazione di modelli periodici. Poiché la variabile indipendente esprime un ciclo

temporale, essa trova la sua forma rappresentativa nelle serie cicliche, caso particolare di serie

temporale.!

Serie spaziali: con la stessa concezione delle serie temporali, è possibile esporre situazioni che

implicano criteri geografici, di territorialità o assimilabili. Di conseguenza, vengono create delle

serie spaziali o geografiche in quanto le osservazioni riguardano zone ben definite.!

!

Elaborazione dei dati!

Il ricercatore, applicando le tecniche di calcolo e di confronto corrette, completa il progetto di lavoro

finalizzato alla conoscenza del fenomeno osservato. !

La correttezza del metodo applicato e la scelta di tecniche appropriate sono fondamentali per

raggiungere gli scopi previsti dall’indagine.!

!

Sintesi e rappresentazione dei dati!

E’ il complesso di tecniche che permette di rappresentare una mole di dati in modo sisntetico e

mediante grafici esplicativi.!

!

Interpretazione e presentazione dei risultati!

Verifica la plausibilità dell’ipotesi iniziale, cerca giustificazione per quanto riscontrato e procede a

una loro divulgazione.!

!

!

5 Gli indici di tendenza centrale!

Sintesi dei dati!

Per concentrare l’informazione di una serie di misure, è necessario identif

Dettagli
Publisher
A.A. 2012-2013
14 pagine
5 download
SSD Scienze mediche MED/01 Statistica medica

I contenuti di questa pagina costituiscono rielaborazioni personali del Publisher Paraz92 di informazioni apprese con la frequenza delle lezioni di Statistica medica e studio autonomo di eventuali libri di riferimento in preparazione dell'esame finale o della tesi. Non devono intendersi come materiale ufficiale dell'università Università degli Studi di Milano o del prof Ambrogi Federico.