Forschungs-IT

Wissensaustausch ist Datenaustausch

Die Arbeitsgruppe Forschungs-IT arbeitet an der Harmonisierung von Prozessen und IT-Systemen zwischen den Deutschen Zentren der Gesundheitsforschung.

Die DZG forschen als Netzwerk gemeinsam für die Gesundheit. Eine zentrale Rolle spielt dabei der effiziente und sichere Datenaustausch zwischen den unterschiedlich spezialisierten Zentren. Die Daten aus Forschung, Klinik und der Analyse von Bioproben sind ebenso wie Informationen aus der Grundlagenforschung vielschichtig und heterogen. Damit diese hochdimensionalen Daten standardisiert erhoben und verarbeitet werden können, werden sie in den DZG nach dem FAIR-Prinzip erfasst. Das Akronym steht für vier zentrale Prinzipien der Datenverarbeitung: Die Daten sollen leicht auffindbar (Findable), gut zugänglich (Accessible), miteinander vereinbar (Interoperable) und vor allem wiederverwendbar (Reusable) sein. Um das zu gewährleisten, wollen die DZG ihre Prozesse und Werkzeuge der datenschutzgerechten Forschungs-IT gemeinsam und interoperabel weiterentwickeln.

Auswahl von gemeinsamen DZG-IT-Projekten

LEOSS

Die SARS-CoV-2-Pandemie ist für die Mediziner:innen weltweit eine große Herausforderung, da täglich neue Infektionen hinzukommen. Zu Beginn der Pandemie bestand eine Wissenslücke in Bezug auf die bestmögliche klinische Behandlung der Infektion sowie die Vorhersage und Vorbeugung von schweren Folgen. Es wurde das Projekt Lean European Open Survey on SARS-CoV-2 (LEOSS), eine prospektive europäische multizentrische Kohortenstudie, initiiert, um detailliertere Erkenntnisse über die Epidemiologie und den klinischen Verlauf der mit SARS-CoV-2 infizierten Patienten zu gewinnen. Unser Ziel war es, ein schnelles und einfaches Register zu erstellen, das eine anonyme Dokumentation der Patienten ermöglicht. Die Studie wird die retrospektive Einbeziehung von Patient:innen ermöglichen, die vor Beginn der Studie behandelt wurden. Die gewonnenen Daten können verwendet werden, um verschiedene Forschungsfragen zu beantworten, wie z. B. die Identifizierung unabhängiger Prädiktoren für das Ergebnis bei Patient:innen mit diagnostizierter Infektion durch SARS-CoV-2. Die innerhalb der LEOSS-Gemeinschaft entwickelte Datenverwendungs- und -zugangsrichtlinie ermöglicht eine dynamische und schnelle wissenschaftliche Nutzung der Daten unter Wahrung einer hohen wissenschaftlichen Qualität sowie einer verantwortungsvollen öffentlichen Kommunikation.

DZDconnect

Am DZD wurde der Wissensgraph („knowledge graph“) DZDconnect entwickelt, der Daten aus der Grundlagenforschung und aus klinischen Studien standort-, disziplin- und speziesübergreifend mit externem Wissen verknüpft. In ihm werden verschiedene Daten und Informationen zu weit verbreiteten Krankheiten und deren Langzeitkomplikationen gesammelt, strukturiert und vernetzt und die Ergebnisse unkompliziert zur Verfügung gestellt. Informationen aus etablierten Datenbanken werden dabei auf Metadaten-, Ergebnis- sowie Rohdatenebene miteinander verbunden. Darüber hinaus können eigene Daten aus der translationalen Forschung integriert werden. Die Basistechnologie ist eine flexible und skalierbare Graphdatenbank. Damit gelingt der Brückenschlag zwischen Wissenschaft und moderner Informationstechnologie, um die Erforschung der Volkskrankheiten schneller und effizienter zu machen. Mit dem als Open-Source-Projekt entwickelten DZDconnect können Wissenschaftler*innen zügig und effizient Hypothesen darüber generieren, welche Mechanismen diesen Krankheiten zugrunde liegen und wie medizinisch eingegriffen werden kann.

DZDDataSharingService (DSS)

DSS ist ein Service für den transienten DSGVO-konformen Transfer für medizinische Daten, basierend auf Nextcloud. Zentrale Aufgaben sind: Logging jedes Eintrags (Metadaten und Herkunft), Verschlüsselung des Speichers und automatische Löschung der Daten nach einem definierten Zeitlimit (gemäß der Datenschutzverordnung).
Link zum Concept whitepaper
Link zum Technical setup

Informatics for Integrating Biology and the Bedside (i2b2)

Informatics for Integrating Biology and the Bedside (kurz: i2b2) ist ein Werkzeug zur Speicherung und Abfrage von biomedizinischen Daten. Entwickelt wurde es von einem Forschungsteam der Harvard Universität, um die klinische Forschung zu unterstützen. Wissenschaftler:innen können es nutzen, um Patientenkohorten zu identifizieren, Machbarkeitsabfragen für Studien durchzuführen und rückblickend die verfügbaren Daten zu analysieren.

Das Datenbankschema von i2b2 ist zweigeteilt: (1) klinische Daten, aufgeteilt in Listen für Patient:innen, Visiten und Fakten und (2) Metadaten zur Beschreibung und Strukturierung klinischer Begriffe in einem Metadaten-Baum/Thesaurus. Mit der Benutzeroberfläche können Forschende Abfragen zusammenstellen, indem sie die klinischen Parameter mit UND- und ODER-Verknüpfungen kombinieren und in zeitlichen Bezug setzen. Die Ergebnisse dieser Abfragen beinhalten aggregierte Informationen über die Patientenkohorten, welche alle Kriterien erfüllen.
www.i2b2.org

Collaborative Metadata Repository (CoMetaR)

CoMetaR ist eine Anwendung, um biomedizinische Metadaten zu bearbeiten, zu versionieren, zu visualisieren und gemeinsam zu nutzen. Dabei werden die FAIR-Prinzipien und etablierte Standards berücksichtigt. Die Daten werden als RDF (Unicode-Textdateien) gespeichert, einem flexiblen W3C-Standard zur Beschreibung jeglicher Ressourcen im World Wide Web. Durch die Versionierung über Git können die Herkunftsinformationen (Provenance) der gespeicherten Metadaten extrahiert werden. Die CoMetaR-Webanwendung ermöglicht es Nutzenden, den gesamten Metadaten-Baum zu durchsuchen.

Unter Verwendung der standardisierten SPARQL-Schnittstelle können alle verfügbaren Metadaten strukturiert abgerufen werden. Für die Modellierung des Thesaurus werden das W3C Simple Knowledge Organization System (SKOS) sowie weitere Standards für die Annotation von Metadaten (bspw. Dublin Core) verwendet. Durch die Verwendung von Standardvokabular, einer standardisierten Abfrageschnittstelle und internationalen Codes aus Terminologien wie SNOMED-CT, ICD-10 und LOINC sind die Metadaten in hohem Maße interoperabel.

Mitglieder der Arbeitsgruppe
  • Markus Brechtel (DZIF)
  • Dr. Steffen Cordes (DZHK)
  • Daniel Erkan (DZNE)
  • Meike Fünderich (DZL)
  • Silke Greuel (DZNE)
  • Dr. Stephanie Heinen (DZIF)
  • Dr. Julia Hoffmann (DZHK)
  • Jori Kern (DKTK)
  • Prof. Dr. Martin Lablans, stellv. Sprecher (DKTK)
  • Dr. Raphael Majeed, Sprecher (DZL)
  • Dr. Annika Spottke (DZNE)
  • Prof. Dr. Jörg Janne Vehreschild (DZIF)
  • Nils Opel (DZPG)
  • Nikolaos Koutsouleris (DZPG)
  • Dr. Lars Oest (DZD)
  • Angela Dedié (DZD)
  • Tim Bleimehl (DZD)