Seiteninterne Suche

Projekte

Integrated Data Repository Toolkit (IDRT)

 

Im „Integrated Data Repository Toolkit (IDRT)“-Projekt wurde eine Plattform zur nachhaltigen und datenschutzkonformen Verwertung heterogener Datenbestände für die klinische und translationale Forschung entwickelt.

Das Projekt wurde in Zusammenarbeit mit der Abteilung Medizinische Informatik der Universitätsmedizin Göttingen und dem Institut für Medizinische Informatik, Statistik und Epidemiologie der Universität Leipzig umgesetzt.

Sowohl in der Routineversorgung von Patienten als auch in Forschungsprojekten entstehen umfangreiche Datensammlungen, für deren Integration und Abfrage kaum geeignete Werkzeuge verfügbar sind. Mit der i2b2-Plattform steht zwar ein mächtiges Abfrage­werkzeug zur Verfügung, das jedoch selbst keine Funktionen zur Aufbereitung der nötigen Quelldaten und Konzepthierarchien bietet.

Im IDRT-Projekt wurden daher basierend auf der Open Source-Plattform Talend Open Studio Komponenten zur Extraktion von Quelldaten in verschiedenen etablierten Formaten (CDISC ODM, CSV, SQL-Datenbanktabellen) entwickelt, mit denen Forschungsverbünde ihre Rohdaten leicht für die Abfrage mit i2b2 aufbereiten können. Eine Integration des TMF PID-Generators ermöglicht darüber hinaus die Zusammenführung von Daten verschiedener Quellen zu einem gemeinsamen Datensatz.

Um die strukturierte Abfrage in i2b2 zu erleichtern, wurden verschiedene verbreitete medizinische Terminologien (u.a. ICD10-GM, OPS, LOINC) für die Nutzung in i2b2 aufbereitet. Darüber hinaus wurde ein integriertes Importpaket für den §21-Datensatz entwickelt, der im Rahmen der DRG-Abrechnung in jedem deutschen Krankenhaus generiert werden kann und so einen schnellen Einstieg in die Datenabfrage mit i2b2 bietet.

Das Projekt wurde in 03/2013 mit einem europäischen i2b2- und Disseminationsworkshop abgeschlossen. Ein Nachfolgeprojekt „IDRT2“ wurde von der TMF genehmigt und soll die Arbeiten nahtlos fortsetzen und u.a. Komponenten zur Transformation der importierten Daten sowie zur Unterstützung komplexer Datenstrukturen wie Biomaterialdaten erarbeiten.