Seiteninterne Suche

IMI Archiv

Konzeption und Umsetzung einer Big-Data-Omics-Integrations-Pipeline [Master]

Interessiert an einer Masterarbeit „Big-Data-Omics-Integrations-Pipeline“ in

  • einem Thema im Spannungsfeld zwischen Medizinischer Informatik, Bioinformatik, Informatik und Molekularbiologie/-medizin?
  • einer wissenschaftlichen Arbeit mit starkem Praxisbezug?
  • einer Einbindung in ein oder zwei größere Projekte mit Partnern aus Universität, Klinik und Wirtschaft?
  • konkreter Rahmengestaltung bei gleichzeitiger Ausgestaltung gemäß individueller Interessen?
  • ab WS 17/18 und exzellenter Betreuung?

Dann komme zur Abklärung der Details und Rahmenbedingungen auf uns zu!
Lehrstuhl für med. Informatik, Kontakt Jan Christoph: jan.christoph@fau.de

Hintergrund

Im Rahmen des Projekts Klinische Datenintelligenz wurden im Anwendungsfall Brustkrebs mit der Frauenklinik sowohl klinische als auch biomedizinische „~omics“ Daten (Gen-Expressionsdaten + SNPs/Mutationen) in die Plattform tranSMART importiert. TranSMART [1] bietet ein ausgefeiltes Datenmodell zur Integration von klinischen und omics-Daten sowie rudimentäre Analyse-Methoden derselben, z.B. für die Suche nach Biomarkern, und findet bei klinisch Forschenden Anwendern zunehmend Verbreitung.

Im Rahmen des Projekts MelEVIR werden in einem Team aus Dermatologen und Systemmedizinern des UKER sowie Bioinformatikern aus Rostock ebenfalls Omics-Daten generiert und in der Forschungsplattform SEEK [2] gespeichert, die in der Grundlagenforschung von (Bio-)Informatikern/Systembiologen häufig verwendet wird.

Problemstellung

Bislang existieren die beiden Forschungsplattformen tranSMART [1] und SEEK [2] am Universitätsklinikum Erlangen (UKER) nur losgelöst nebeneinander, wobei insbesondere im MelEVIR-Projekt wegen der starken Verbindung zwischen Grundlagenforschung und klinischer Umsetzung (idealtypische Umsetzung des translationalen Gedankens) eine Verknüpfung sehr relevant wäre.

Außerdem bietet tranSMART durch seine offenen Schnittstellen die Möglichkeiten, an seine Plattform weiterführende Analyse-Methoden und Frameworks anzudocken; davon gibt es in der Literatur bereits einiges tolle Arbeiten [3,4], die jedoch am UKER bislang noch nicht näher auf die eigenen Bedürfnisse geprüft oder umgesetzt wurden.

Inhalt / Umsetzung

Es gibt bereits zwei 2015 bzw. 2016 erfolgreich abgeschlossene Masterarbeiten in diesem Gebiet, die tranSMART am UKER etablierten bzw. mit detaillierten Übersichten der Analyse- und Schnittstellen-Möglichkeiten eine sehr gute Ausgangsbasis für die nun ausgeschriebene Masterarbeit für den Abschluss bieten.

Denkbare, nach individuellen Interessen und Kompetenzen vertief- oder verkürzbare, Teilbereiche der Arbeit wären damit:

  • Einarbeitung in
    • Struktur / Natur der Omics-Daten der beiden o.g. Projekte
    • Verständnis von Analyse-Methoden wie Pathway-Analysis oder GWAS
    • Struktur, Features und Schnittstellen von
      • tranSMART [1] und SEEK [2]
      • Andockende Tools/Framworks wie Galaxy [4], PLINK u.ä.
  • Konzeptionelle Phase
    • Kleine Anforderungsanalyse, wie der genaue Bedarf seitens der beteiligten Forscher aussieht (wie werden die Daten derzeit gespeichert und ausgewertet, wo liegt Optimierungspotential bzw. grundsätzlich existentes, aber bislang nicht nutzbares Analyse-Potential)?
    • Wie können die jeweiligen Programme über ihre Schnittstellen zu einer Omics-Pipeline miteinander verbunden werden (Vorbild siehe [3])?
  • Praktische Phase
    • Prototypische Integration von bereits laufendem tranSMART (eigener Lehrstuhl) mit ebenfalls bereits laufendem SEEK (bei Partner in Dermatologie bzw. eigenem noch zu installierendem Service).
    • Installation von PLINK/Galaxy/zuvor identifizierten Analyse-Programmen und Integration mit tranSMART oder SEEK
    • Entwicklung eigener Analyse-Plugins für tranSMART, z.B. mittels smartR
  • Evaluation
    • technisch: nutzbare Features der Analyse-Methoden, Limitierungen durch ggf. unsaubere oder nicht vorhandene Daten / begrenzte Rechenkapazität => Cluster u.ä.
    • ggf. user-Sicht: was ermöglichen die Tools, wie werden sie genutzt, z.B. ermöglicht Visualisierung erst Nutzbarkeit durch weniger erfahrene Nutzer, für Lehrzwecke nutzbar, ermöglicht oder fördert sie Erkennung des Wesentlichen u.ä.

Anschlussarbeiten könnten die Berechnungen in einem Cluster oder Cloud sowie eine Verstetigung der geschaffenen Infrastruktur sein.

Lektüre zur Einstimmung

PDF zum Download/Ausdruck: 2016-08-10_Ausschreibung-Masterarbeit_tranSMART-Galaxy-SEEK.pdf