Pressemitteilung

Eine Eins mit 18 Nullen – Projekt zur Lang­zeit­archivierung von medizinischen Forschungs­daten gestartet

Das Speichervolumen medizinischer Forschungs­daten ist gigantisch. Wie man sie langfristig sinnvoll archivieren kann, untersucht ein von der DFG gefördertes Projekt.

Headergrafik für das Thema Genommedizin & Biobanken

© Zubada - stock.adobe.com

Daten sind der wichtigste „Rohstoff“ der biomedizinischen Forschung: ihre Auswertung und Analyse ermöglicht beispielsweise die Entwicklung besserer Arzneimittel und Therapien und trägt somit maßgeblich besseren Behandlungs­möglichkeiten und größeren Heilungschancen bei. Die Daten sollten deshalb für eine langfristige Nutzung und unterschiedliche wissenschaftliche Fragestellungen zur Verfügung stehen.

Papierarchiv by DMI

Elektronische Archive müssen in der Dauer der Aufbewahrungszeit und Lesbarkeit der Inhalte mit Papierarchieven konkurrieren können. (Bild: deliciousphotography.de/DMI) © TMF e.V.

Zielrichtung des am 1. Juni 2011 unter Federführung von Prof. Dr. Otto Rienhoff, Abteilung Medizinische Informatik der Universitätsmedizin Göttingen, gestarteten Projekts LABIMI/F, an dem auch die TMF und die Arbeitsgemeinschaft der Wissenschaftlichen Medizinischen Fachgesellschaften (AWMF) mitarbeiten, ist die Entwicklung effektiver Lösungen für die Nachnutzung archivierter Forschungsdaten.

„Bislang liegen für viele Bereiche der Datenarchivierung in der medizinischen Forschung weder einheitliche Archivierungs­erfordernisse noch bereits implementierte Daten- und Objektformate vor“, so Frank Dickmann von der Universitätsmedizin Göttingen beim Kickoff-Workshop des Projekts, der am 9. Juni 2011 bei der TMF in Berlin stattfand. Da man es jedoch Dickmann zufolge bei der Lang­zeit­archivierung medizinischer Forschungsdaten mit Volumina in der Größenordnung von Exabytes¹ (ein Exabyte entspricht einer 1 mit 18 Nullen) zu tun hat, sind neben gigantischen physischen Datenspeichern, die eine sichere Verwahrung und einen schnellen Zugriff auf die Daten ermöglichen, auch sehr gute Datenbeschreibungen, Regelungen zum daten­schutz­gerechten Zugriff und zur bestehende Rechte wahrenden Datennutzung sowie effektive Zugangswege nötig.

Anhand von zwei besonders datenintensiven Nutzungsfällen, den Bilddaten des Universitätsklinikums Magdeburg und den Genomdaten des Universitätsklinikums Schleswig-Holstein in Kiel, sollen in dem Projekt speziell die Aspekte Metadaten und Formatstandard für die biomedizinische Forschung adressiert werden. Denn die Interpretation von archivierten Forschungsdaten kann später schwierig oder gar unmöglich werden, wenn Forscher keine einheitlichen Datenformate und eindeutige Datenbeschreibungen verwenden.

Auch der physische Zugriff auf die Daten soll vereinfacht werden. Da Wissenschaftler häufig in Forschungsverbünden, interdisziplinär und an verteilten Standorten arbeiten, wird im Projekt eine Laborlösung mit vorhandener Grid-Technologie implementiert, die einen sinnvoll organisierten, offenen und nutzerfreundlichen Zugang zu archivierten Forschungsdaten schaffen soll. Darüber hinaus befasst sich das Projekt mit der Entwicklung von organisatorischen und finanziellen Betriebskonzepten, die die langfristige Finanzierung von elektronischen Langzeitarchiven sichern sollen.

 

¹ Der US-amerikanische Medizininformatiker Barry Robson prognostizierte 2009 nur für die medizinische Bildgebung weltweit ein Aufkommen von 150 Petabyte pro Jahr (Barry Robson, „The engines of Hippocrates, John Wiley & Sons Inc., 2009, S.17). Archiviert man solche Datenmengen über mehrere Jahre, gelangt man sehr bald in Größenordnungen von Exabytes an zu archivierenden Daten.

 

Pressekontakt:

Antje Schütt 
Telefon: 030 – 31 01 19 56

Beate Achilles
Telefon: 030 – 31 01 19 51

E-Mail