Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
Scarica il documento per vederlo tutto.
vuoi
o PayPal
tutte le volte che vuoi
PACS.
nostro sistema informativo ospedaliero fa riferimento al Il RIS gestisce il riparto di radiologia ma le
immagini vengono archiviate e gestite dal PACS.
STANDARD HL7 . HL7 è stato presentato qualche
Parliamo ancora degli standard funzionali, che abbiamo già visto prima
decina di anni fa e si è diffuso notevolmente, codifica modalità di comunicazione tra vari sistemi, altrimenti
sarebbe molto complicato avere un’interfaccia diversa per ogni coppia di sistemi che vogliono comunicare
tra loro. L’applicazione che gestisce il singolo dato è localizzato ad un ipotetico settimo livello. Si tratta di una
modalità di scambiare messaggi in maniera codificata con messaggi scritti come stringhe di caratteri. L’idea
è che tutte le volte che abbiamo un trigger event un elemento del sistema informativo manda un messaggio
ad un altro che riceve il messaggio e a sua volta manda un messaggio di conferma di ricezione. In realtà si
tratta di qualcosa di molto semplice anche se il lavoro di traduzione è complesso. Immaginiamo un paziente
ammesso in ospedale, il sistema di registrazione manda un messaggio al sistema che si deve occupare
dell’aspetto amministrativo e di costi per informare del nuovo paziente… ogni evento determina l’invio di un
messaggio ai vari elementi del sistema informativo coinvolti. I messaggi si presentano come sfilze di caratteri
in cui abbiamo:
- i segmenti che individuiamo nelle righe distinte del messaggio;
- dei campi che sono separati da barre verticali o eventualmente divisi in
- più componenti (separate dal carattere cappuccio).
Ci sono eventi di vario tipo che possono determinare un messaggio, per esempio la dimissione, il
trasferimento o la pre-ammissione di un paziente.
I segmenti principali del linguaggio HL7 sono:
MSH: la terna di caratteri contraddistingue l’inizio del segmento
• EVN: il segmento relativo all’evento specifico
• PID: segmento relativo all’identificazione del paziente
• NK1: campo relativo al parente più prossimo
• PV1: segmento relativo alla visita del paziente
•
Come scrivo un messaggio secondo questo standard? Ho delle regole per cui per un segmento abbiamo la
sequenza del campo (primo, secondo, terzo etc.) quindi un ordinale che mi indica l’ordine e per ogni campo
abbiamo il numero di caratteri che esso può contenere, il tipo di dato, l’opziionalità (campo obbligatorio o
opzionale), la possibilità di ripetizione e un numero che fa da riferimento per i valori possibili per quel campo.
Ho una tabella guida del genere per ogni segmento e campo (user-defined tables).
Considerando alcuni dati aggiuntivi (es. nome applicazione invio, id controllo, nome ospedale, come deve
essere composto il nostro segmento, alcuni aspetti di formattazione) ottengo il messaggio per la pre-
ammissione del paziente.
Nelle tabelle ho l’ordine dei campi, le regole dei campi e quindi posso trovare i valori contemplati da inserire
nel campo specifico. Avrò una lista di campi possibili per il segmento evento con le stesse regole: l’ordine, le
caratteristiche e ove necessario la lista dei valori possibili da assegnare; stessa cosa per ogni segmento.
In esame potremmo dover ricostruire un segmento del messaggio data la tabella con tutte le informazioni
che ci servono.
LEZIONE 4
Standard semantici
La corretta interpretazione di un messaggio verbale è garantita dall’esperienza dei soggetti e dal contesto, se
le informazioni vengono automatizzate è necessario usufruire degli standard.
Abbiamo ambiguità nella comunicazione automatica:
polisemia: quando una parola può avere significati differenti
• sinonimia: parole diverse con lo stesso significato
• omonimia
•
Dal punto di vista del linguaggio naturale possiamo esprimere un concetto in maniera molto varia e riferire
sempre la stessa idea.
Nomenclatura: sottoinsieme della terminologia.
Classificazione: sistema ordinato di concetti in categorie.
Terminologie: insieme di vocaboli controllati.
Tassonomia: classificazione delle frequenze e delle loro possibili combinazioni.
Il vocabolario controllato è un elemento chiave per l’interoperabilità:
- non ambiguo
- contesto chiaramente definito
- standardizzato
- abbiamo concetti che richiedono integrazione nel vocabolario
- più rigido, meno accurato
- può permettere di esprimere concetti articolati man mano che evolve
Si arriva alle terminologie standard combinando il concetto, la definizione del concetto e la sua codifica.
Il concetto in biomedica può essere una patologia. L’identificazione di un concetto con un codice è necessaria
ed è la regola, quindi ogni concetto benchè dotato di un nome e di una descrizione deve avere un codice
pre-coordinati post-coordinati.
alfanumerico. Distinguiamo tra vocabolari e Nel primo caso termini più
complessi sono definiti a priori (es. severo mal di testa > avremmo già un concetto preimpostato che
comprenda già i gradi di intensità e la patologia) mentre il secondo permette l’integrazione del concetto
stesso, quindi non combinato con altri.
SNOMED CT
La SNOMED è una terminologia sviluppata dal College of American Pathologist e contiene termini relativi a
tutte le discipline mediche (anche quella veterinaria). In Italia viene usato dalla AP. Permette di combinare
insieme termini singolo di specificare e aggiungere elementi qualitativi ad un concetto. È consultabile
direttamente online. **
Com’è organizzato SNOMED? Abbiamo concetti organizzati in gerarchie, aspetto ricorrente nei vocabolari
biomedici.
|is a| ci dice che un concetto è istanza di un altro concetto solitamente più generico, rappresenta una
Parents:
relazione. concetti che stanno un livello più in alto nella gerarchia, il concetto è legato ai suoi
‘parents’ tramite |is a|. Ho diversi attributi attribuibili allo stesso termine. La stessa idea può essere
rappresentata in maniera tabulare (slide 23). Altri tipi di relazione a slide 24.
A ribadire la stessa idea è che abbiamo un concetto in relazione a un altro concetto e abbiamo relazioni di
diverso tipo, prima tra tutti |is a|. Esempi nelle slide seguenti.
Diabete è istanza di complicanza diabete, disordini del piede, problemi di tipo tissutale; tra gli attributi (giallo)
abbiamo il sito fisico del disturbo piede e un sito che interessa un certo tipo tissutale.
Riassumendo: abbiamo dei concetti a cui è associato un identificatore, questi sono descritti riferendo tutte
le parole che posso usare per esprimere lo stesso concetto in modo che in modo automatico lo si possa
riconoscere, viene indicato il modo preferenziale per comunicare il concetto e in più troviamo delle relazioni,
quindi il vocabolario è qualcosa di più evoluto.
Il concetto da cui partiamo e i concetti ad esso collegato (slide 34) che possiamo individuare come istanze o
concetti target. Nella gerarchia abbiamo termini genitori e termini figli che, come detto, indicano la presenza
di termini più generali che via via vengono specificati.
**Posso trovare un concetto articolato già come singolo termine dotato di identificatore. Questo è come al
solito dotato di |is a| e di contributi specifici. La stessa idea possiamo costruirla anche assemblando concetti
più semplici quindi associando ad appendicectomia il concetto di emergenza e di intervento in laparoscopia.
ICD
ICD è una standardizzazione relativa alla classificazione delle patologie, quindi contiene solo termini che si
riferiscono a malattie e traumatismi, è nato come idea nell’800 con la necessità di classificare la causa di
morte, all’inizio infatti conteneva solo malattie mortali. ICD è seguito da un numero, adesso siamo al 10, ma
la 9 è ancora utilizzata a seconda dei contesti. Anche questa risorsa è consultabile online e si tratta
sostanzialmente di una classificazione di patologie in diversi capitoli (22) che si riferiscono a diverse categorie
di patologie o traumatismi.
ICD-10-CM ha una sorta di bilateralità, ovvero differenzia tra parte del corpo destra o sinistra.
UMLS è una sorta di contenitore universale che raccoglie i diversi dizionari medici che esistono, quindi una
sovrastruttura. Contiene più di 100 vocabolari e c’è lo sforzo di raccogliere informazioni anche in lingue
diverse rispetto all’inglese.
Methathesasurus: attraverso questo si può accedere agli altri vocabolari presenti. C’è ancora l’idea di
identificatore per concetto e di relazioni tra concetti.
Rete semantica: sforzo di codificare delle categorie di interesse in ambito biomedico e metterle in relazione
tra loro.
Specialist Lexicon: sono applicazioni software per il processing del linguaggio naturale per associarlo il più
possibile all’informatizzazione attraverso strumenti di supporto (come Dorland’s Illustrated Medical
Dictionary).
Gene Ontology
C’è stato uno sforzo analogo a livello di biologia molecolare per cercare di codificare termini specifici per i
geni, quindi il GO è nato sopra la funzione molecolare e la componente cellulare. Questo tipo di vocabolario
è utilizzato per descrivere l’attività dei geni. Quello che si sa viene distillato in questo vocabolario controllato.
Anche questo è organizzato in modo gerarchico. L’idea è di processare in maniera automatica l’informazione
che ho rispetto ai geni. Diventa difficile gestire (andare a vedere a mano cosa fa ogni gene) un esperimento
dove migliaia di geni si muovono, mentre con questo strumento. Questo perché migliaia di termini di questo
vocabolario sono associati ai geni come etichette e a quel punto il tutto è automatizzabile perché posso
vedere quali sono i geni con la stessa etichetta, lo stesso termine. Qual è il termine che è presente in un solo
gene.
Nel momento in cui ho un esperimento ad alto rendimento, la situazione tipica è che ho una lista di qualche
migliaio di geni che fanno qualcosa.
Se su 1000 geni 100 hanno un certo termine del vocabolario confrontato, quei 100 sono tanti o sono pochi,
il concetto è rilevante oppure no? Devo utilizzare la distribuzione ipergeometrica dove utilizzo la formula in
slide 77 per riconoscere quali variabili abbiamo in gioco. Ho m geni annotati con un termine (q) geni allocati
con un certo termine del vocabolario, k sono i geni della mia lista (1000) dove ho q geni con un termine, t è
il numero di geni nel mio vocabolario.
6000 palline di cui 100 sono bianche. Il fatto che x tra 80 palline estratte siano bianche è significativo oppure
no? Se 10 su 80 sono bianche può essere rilevante, mi discosto dal caso. Questa è l’idea dell’analisi del
rendimento che