Seiteninterne Suche

IMI Archiv

Bewertung eines modernen Freitextverarbeitungswerkzeugs zur automatisierten Analyse von Einschlusskriterien für klinische Studien

Masterarbeitsthema Informatik oder Medizintechnik

Hintergrund

Klinische Studien zur Erzeugung neuen medizinischen Wissens beinhalten typischerweise aufwändige Datenverarbeitungsvorgänge, die vielfältige Digitalisierungsansätze versprechen [1]. In Verbindung mit umfangreichen Datenbanken wie insb. clinicaltrials.gov ermöglicht ergeben sich hierbei auch innovative Anwendungsoptionen, wie etwa Abfrage- und Visualisierungsinstrumente mit räumlich beschränkten Filterkriterien [2]. Zu den typischen Herausforderungen einer elektronischen Unterstützung Studien-spezifischer Prozesse, beispielsweise zur automatisierten Identifizierung rekrutierbarer TeilnehmerInnen, gehört der technische Umgang mit konventionellen Freitexten, die etwa das Studienziel oder die vorgesehenen Ein- und Ausschlusskriterien repräsentieren.

Freitextverarbeitungsmethoden (Natural Language Processing, NLP) sind beispielsweise einsetzbar, um freitextliche Einschlusskriterien in Datenbankfragen umszuwandeln, oder um umfangreiche Studienbeschreibungen automatisiert zu kürzen [3]. Moderne Spezialwerkzeuge wie scispaCy [4] zur Vektor-basierten Verarbeitung medizinischer Freitexte versprechen methodische Fortschritte bei der automatisierten Verarbeitung solcher Domänen-spezifischer Eingaben, wobei kürzlich publizierte Datensätze [5] mit annotierten Einschlusskriterien systematische Tauglichkeitsbewertungen vereinfachen sollten.

Ziele und Aufgaben

Nach einer Einarbeitung in den typischen Ablauf sowie in bisherige Digitalisierungsansätze klinischer Studien soll im Rahmen dieser Arbeit die Eignung unterschiedlicher scispaCy-Funktionen (Vektor-Repräsentationen, UMLS-EntityLinker) zur automatisierten Identifizierung relevanter Merkmale wie Erkrankungen (Diagnosen), klinischen Messwerten sowie Medikamenten in englischsprachigen Studienbeschreibungen von clinicaltrials.gov überprüft werden.

Anforderungen/Voraussetzungen:

Interesse an vielfältigen technischen und nicht-technischen Aufgaben. Grundkenntnisse medizinischer Ordnungssysteme und Programmiererfahrung (insb. in Python), oder die Bereitschaft zur entsprechenden Einarbeitung.

Quellen

[1] Employing computers for the recruitment into clinical trials: a comprehensive systematic review. Köpcke & Prokosch. 2014. DOI: 10.2196/jmir.3446

[2] StudyPortal – A Novel Method to Visualize Study Research Networks. Varghese et al. 2019. Stud Health Technol Inform. 2019;258:163. PMID: 30942737

[3] Extractive summarization of clinical trial descriptions. Gulden et al. 2019. DOI: 10.1016/j.ijmedinf.2019.05.019

[4] ScispaCy: Fast and Robust Models for Biomedical Natural Language Processing. Neumann et al. 2020. DOI: 10.18653/v1/W19-5034, https://allenai.github.io/scispacy/

[5] Chia, a large annotated corpus of clinical trial eligibility criteria. Kury et al. 2020. DOI: 10.1038/s41597-020-00620-0

Kontakt

Lehrstuhl für Medizinische Informatik, Friedrich-Alexander-Universität Erlangen-Nürnberg

Dr. Dennis Toddenroth        (dennis.toddenroth@fau.de)

Christian Gulden                   (christian.gulden@fau.de)