News

Record Linkage von unterschiedlichen Datenarten

Workshop auf der GMDS-Jahrestagung am 20.09.2023

Dr. Johannes Drepper und Dr. Knut Kaulke beim Record Linkage Workshop

Dr. Johannes Drepper und Dr. Knut Kaulke. © TMF e.V.

Im Gesundheitsbereich werden personenbezogene Daten meist zweckgebunden gespeichert und verarbeitet, sei es zur Patientenversorgung, wie in Krankenhausinformationssystemen, oder zur medizinischen Forschung in Studiendatenbanken und Registern. Trotz ihrer Vorteile haben diese Datenquellen oft Schwächen wie fehlende oder fehlerhafte Informationen. Um diese Lücken zu schließen, können sie datenschutzkonform mit anderen Datenquellen verknüpft werden, wobei diese Verknüpfung hohen Qualitätsstandards genügen muss. Für Forschungszwecke ist es wichtig, bereits vorhandene Datenquellen auf ihre Eignung und Zulässigkeit für das geplante Vorhaben zu prüfen. Falls diese nicht ausreichen oder nicht genutzt werden dürfen, müssen neue, sogenannte Primärdaten, erhoben werden.

Die TMF-Workshops auf den GMDS-Jahrestagungen haben in den letzten Jahren kontinuierlich die Themen rund um Record Linkage und datenschutzkonforme Datenverarbeitung in der medizinischen Forschung behandelt. Beginnend mit dem Schwerpunkt auf elektronischen Treuhänderdiensten im Jahr 2018 in Osnabrück, über standortübergreifendes Record Linkage 2019 in Dortmund, bis zum neuesten Schwerpunkt auf der Verknüpfung unterschiedlicher Datenarten am 20. September 2023 in Heilbronn. 

Im Workshop auf der GMDS-Jahrestagung am 20.09.2023 in Heilbronn wurde das Record Linkage von unterschiedlichen Datenarten anhand von Anwendungsfällen geschildert und beinhaltete folgende Verknüpfungsvarianten:

  • Krebsregisterdaten und NAKO-Daten (Tobias Hartz, Klinisches Krebsregister Niedersachsen)
  • Notaufnahmedaten und KV-Daten (Dr. Christian Lüpkes, Offis Oldenburg)
  • Epidemiologische Primärdaten und Krankenkassendaten und Krebsregisterdaten (Dr. Timm Intemann, Leibniz-Institut für Präventionsforschung und Epidemiologie – BIPS)
  • Daten des Kinderkrebsregisters und Krankenkassendaten (Dr. Peter Ihle, PMV forschungsgruppe)

Anschließend betrachtete Moritz Steiner (TMF e.V.) anwendungsübergreifend die rechtlichen Voraussetzungen und Herausforderungen für das Record Linkage von unterschiedlichen Datenarten. 

Hinsichtlich der technisch-organisatorischen Herausforderungen in den Anwendungsfällen stellt die Verteiltheit bestimmter Daten eine Herausforderung dar, da sie viele unterschiedliche Ansprechpartner involviert. Dies kann zu heterogenen rechtlichen Rahmenbedingungen führen und auch die Datenstrukturen können entsprechend heterogen ausfallen.

Zudem existieren Vertrauensstellen nicht als Standardlösung. Stattdessen handelt es sich um spezialisierte Einrichtungen, die spezifische Forschungsbereiche adressieren. Eine Übersicht über diese Angebote ist derzeit hauptsächlich im ToolPool Gesundheitsforschung verfügbar.

Die aktuell vorhandenen Identifier für Record Linkage sind oftmals nicht ausreichend, insbesondere bei heterogenen Datenarten oder -quellen. Beispielsweise ist die KVNR nicht universell für alle Daten vorhanden oder nutzbar. Die Verwendung von Alternativen zur KVNR kann zudem zu einer geringeren Qualität des Record Linkage führen. Einen Überblick über weitere Möglichkeiten zur Erstellung und Nutzung eines übergreifenden Unique Identifiers gab Dr. Knut Kaulke (TMF e.V.). 

Zum Problem der Verteiltheit der Daten bietet der Ansatz der Medizininformatik-Initiative eine vielversprechende Lösung: Er ermöglicht die Koordination über einen einzigen Ansprechpartner, die Verwendung eines einheitlichen Kerndatensatzes, die Einholung einer informierten Einwilligung (Broad Consent) sowie den Abschluss eines einheitlichen Vertrags, wie Dr. Johannes Drepper (TMF e.V.) berichtet. Darüber hinaus ist ein einheitlich und übergreifend anwendbarer Identifier für die Verlinkung heterogener Datensätze wünschenswert, schlussfolgert Drepper.