Seiteninterne Suche

IMI Archiv

Analyse der semantischen Relationen in allgemeine Datenmodellen aus der Sicht der Medizininformatik-Initiative

Masterarbeitsthema Informatik/Medizintechnik oder Projektarbeit (§ 44 FPOINF)

Hintergrund

Allgemeine Datenmodelle wie beispielsweise Unified Medical Language System (UMLS) fördern die wissenschaftliche Nutzung von Behandlungsdaten, indem sie klinische Merkmale auf Standard-Terminologien abbilden und in einem einheitlichen Format für standortübergreifende Interpretationen zugänglich machen. Die zugrundeliegenden medizinischen Terminologien bieten allerdings nicht nur Begrifflichkeiten zur integrierten Verwendung unterschiedlicher Quellsysteme, sondern enthalten gleichzeitig vielfältige interne Beziehungen wie beispielsweise Synonyme, Verallgemeinerungen (Oberbegriffe), bis hin zu bei bestimmten Erkrankungen betroffenen anatomischen Strukturen.

Diese semantischen Relationen bestehen hierbei sowohl innerhalb einzelner medizinischer Terminologien, als auch zwischen unterschiedlichen Terminologien, und könnten bei systematischer Berücksichtigung zusätzliche Schlussfolgerungen und Funktionen stützen. Entsprechende Anwendungsfelder könnten beispielsweise darin liegen, anhand verknüpfter SNOMED-CT-Codes oder Medical Subject Headings (MeSH Terms) zu bestimmten klinischen Situationen passende Publikationen oder klinische Studien vorzuschlagen. Als Quellen für solche semantischen Beziehungen kommen insbesondere der UMLS Metathesaurus sowie das gemeinsame Datenmodell der Observational Medical Outcomes Partnership (OMOP) in Frage.

Im Rahmen der vom Bundesministerium für Bildung und Forschung geförderten Medizininformatik-Initiative etablieren Universitätskliniken in Deutschland derzeit Forschungsinfrastrukturen zur Erschließung und standortübergreifenden Analyse von Patientendatendaten, in Erlangen als Teil des MIRACUM-Konsortiums. Hierbei bilden Datenintegrationszentren an den Standorten vorliegende klinische Attribute systematisch auf medizinische Standard-Terminologien ab. Die semantischen Beziehungen in den o.g. übergreifenden Datenmodellen könnten Schlussfolgerungen auf weitere verknüpfte Begrifflichkeiten ermöglichen; die vorliegende Arbeit soll die damit verbundenen weiteren Nutzungsoptionen gezielt analysieren.

Ziele und Aufgaben

Einarbeitung in die o.g. medizinischen Datenstrukturen und deren Repräsentationsformate; deskriptive Analyse der darin enthaltenen bzw. über weitere Schnittstellen abfragbaren semantischen Relationen. Für eine Teilstichprobe der medizinischen Datenelemente, die auf lokal dokumentierte Merkmale abgebildet wurden (u.a. Labordaten) eine technische Umsetzung der zugehörigen semantischen Relationen anhand spezialisierter Werkzeuge, welche dann automatisierte Abfragen und Auswertungen gezielt unterstützen sollen (bspw. Graph-Datenbanken wie Neo4j bzw. Visualisierungstools wie D3.js). Analyse weiterer über technische Schnittstellen abfragbarer semantischer Beziehungen zu den betrachteten Begriffen sowie Entwicklung entsprechender Prototypen für passende Abfragewerkzeuge. Abschätzungen des klinischen bzw. wissenschaftlichen Nutzens der importierten bzw. identifizierten semantischen Relationen, und Analyse weiterer lohnenswerter manueller Annotationen.

Anforderungen/Voraussetzungen:

Interesse an vielfältigen technischen und nicht-technischen Aufgaben. Keine Berührungsängste gegenüber medizinischen Fachbegriffen. Grundkenntnisse medizinischer Ordnungssysteme und Erfahrungen in der Verwendung zeitgemäßer technischer Schnittstellen (bspw. JSON-basierter APIs), sowie geeigneter Werkzeuge zur statistischen Analyse bzw. Visualisierung der semantischen Relationen, oder die Bereitschaft zur entsprechenden Einarbeitung.

Quellen

Maier et al. Towards Implementation of OMOP in a German University Hospital Consortium. Appl Clin Inform. 2018 Jan;9(1):54-61. doi: 10.1055/s-0037-1617452.

Prokosch et al. MIRACUM: Medical Informatics in Research and Care in University Medicine. Methods Inf Med. 2018 Jul;57(S 01):e82-e91. doi: 10.3414/ME17-02-0025.

https://www.ohdsi.org/data-standardization/the-common-data-model/

https://www.nlm.nih.gov/research/umls/index.html

Kontakt

Lehrstuhl für Medizinische Informatik, Friedrich-Alexander-Universität Erlangen-Nürnberg

Wetterkreuz 15, 91058 Erlangen

Dr. Dennis Toddenroth        (dennis.toddenroth@fau.de)

Noemi Deppenwiese             (noemi.deppenwiese@fau.de)