Verknüpfung von Forschungsplattformen und deren Data Provenance

Symbolbild zum Artikel. Der Link öffnet das Bild in einer großen Anzeige.

Kontakt: M.Sc., M.Sc. Jan Christoph - jan.christoph@fau.de - 0179 / 949 88 65

Vergabe einer Masterarbeit (Informatik/MPM):

Hintergrund / Problemstellung:

Im Rahmen früherer Projekte wurden und werden die Forschungsplattformen tranSMART und cBioPortal am Uniklinikum etabliert. Diese bieten ein ausgefeiltes Datenmodell zur Integration von klini-schen und omics-Daten sowie rudimentäre Analyse-Methoden derselben, z.B. für die Suche nach Biomarkern. In Projekten von Grundlagenforschern der Bioinformatik oder Systemmedizin werden ebenfalls Omics-Daten generiert und in Forschungsplattform wie SEEK gespeichert oder mittels Galaxy prozessiert.
Bislang existieren die Forschungsplattformen tranSMART [1] & cBioPortal [2] sowie SEEK [3] & Galaxy[4] nur losgelöst nebeneinander; wie ein Zusammenspiel aussehen könnte ist unbekannt. Ebenso, inwiefern sich SEEK&Galaxy zur Versionierung („Data Provenance“) und Langzeitarchivierung eignen, wofür es seitens der Universität Göttingen vielversprechende Indizien (Link) gibt.

Ziele dieser Arbeit:

  • Verknüpfung von tranSMART, cBioPortal, SEEK und Galaxy (soweit sinnig&möglich)
  • Konzept für Data Provenance
  • Kongresspublikation darüber, z.B. in Studies in Health Technology and Informatics

Aufgaben / Fragestellungen (Vorschlag):

  • Einarbeitung
    • Struktur / Natur der Omics-Daten der o.g. Plattformen sowie die damit durchgeführten (Bioinformatik)-Analysen
    • Struktur, Features und Schnittstellen der o.g. Plattformen
  • Konzeptionelle Phase
    • Kleine Anforderungsanalyse bzgl. Bedarfs seitens der beteiligten Forscher
    • Wie können die jeweiligen Programme über ihre Schnittstellen zu einer Omics-Pipeline miteinander verbunden werden (Vorbild siehe [5])?
  • Praktische Phase
    • Prototypische Umsetzung
  • Evaluation
    • technisch
    • tatsächlicher Nutzung/Nutzbarkeit

Zeitrahmen:

  • Beginn jederzeit

Anforderungen / Voraussetzungen:

  • Grundkenntnisse der (Molekular-)Biologie hilfreich
  • Studiengang: Informatik oder MPM mit deutlicher Affinität zum Installieren bzw. Parametrieren von Open-Source Pro-grammen auf Linux-Rechnern.
  • Programmiererfahrung (Java, Typescript)
  • Studiengänge: Informatik, Medizintechnik, IuK oder Vergleichbare

Einstimmende Lektüre: