Zum Hauptinhalt springen
Blogbeitrag

„Eine Herausforderung für uns als Informatik-Community“

Prof. ­Dr.-Ing.­ Ulrike­ Lucke­ ist­ Co-Sprecherin­ des­ Konsortiums­ Nationale­ Forschungsdateninfrastruktur für und mit Computer Science (NFDIxCS), an dem auch die GI beteiligt ist. Im Interview spricht sie über die Ziele des Projekts sowie über die Herausforderungen ­im­ Umgang­ mit­ Forschungsdaten­ aus­ der­ Informatik.

Was ist an Informatik-Forschungsdaten eigentlich so besonders?

In der Informatik betrachten wir nicht nur klassische Daten aus Simulationen, Experimenten, Umfragen oder Logfiles. Auch Software ist für uns nicht nur Werkzeug, sondern unmittelbarer Betrachtungsgegenstand der Forschung und damit eine Art von „Forschungsdaten“. Software und die damit verbundene Ausführungsumgebung sind von besonderer Bedeutung, da sie die Grundlage für unsere wissenschaftlichen Erkenntnisse und Innovationen in der Informatik bilden. Software nachhaltig verfügbar zu machen, erfordert spezielle Techniken. Damit sind dann auch die mithilfe dieser Software erhobenen, erstellten oder verarbeiteten Forschungsdaten – in einem engeren Sinne – langfristig nutzbar.

Wie ist es um die Forschungsdaten der Informatik bestellt?

Die Verfügbarkeit, Qualität und Reproduzierbarkeit von Informatik-Forschungsdaten sind entscheidend für glaubwürdige und breit nutzbare Forschungsergebnisse. Der Zugang zu qualitativ hochwertigen Daten und Software ermöglicht es uns, Hypothesen zu testen, Modelle zu validieren und neue Erkenntnisse zu gewinnen. Allerdings gibt es speziell in unserer Disziplin einige Herausforderungen im Umgang mit Forschungsdaten: Dazu gehören die Bewältigung großer Datenmengen und deren Nachvollziehbarkeit sowie die Nachnutzbarkeit in 10, 15 Jahren, wenn wir möglicherweise längst andere Systeme und Dateiformate nutzen werden. Daten langfristig zu archivieren und zu pflegen ist eine technische, aber auch eine organisatorische Herausforderung für uns als Informatik-Community. Hier fehlen uns teils noch Standards für Formate, Prozesse und Qualitätskriterien. Das Bewusstsein, dass Daten und Software zu teilen einen Gewinn für die Forschung darstellt, ist noch nicht so weit verbreitet wie in manchen anderen Disziplinen. Und nicht zuletzt müssen auch Fragen von Urheberrecht und Datenschutz noch vertieft werden.

Wie wird NFDIxCS helfen, die Situation zu verbessern?

Um den Umgang mit Informatik-Forschungsdaten zu verbessern, werden wir Richtlinien und Infrastrukturen für ihre Verwaltung und den Austausch bereitstellen. Wir möchten Good Practices etablieren und die passenden Repositorien und kollaborativen Plattformen schaffen, um die Forschungsdaten der Informatik aufzunehmen und zugänglich zu machen. Damit werden wir Open Science, Datenaustausch und Interoperabilität fördern. Konkret wollen wir die Umsetzung der FAIR Data Principles für Informatik-Forschungsdaten und Software-Artefakte fördern, die Zitierbarkeit von Software und Informatik-Daten vereinfachen und damit die Publikationsprozesse und -kultur sowohl in der Informatik als auch in ihren Anwendungen modernisieren. Das Schlüsselprinzip von NFDIxCS besteht darin, eine organisatorische und technische, kooperative und interoperable Infrastruktur aufzubauen, um die verfügbaren Kräfte der relevanten Dienste und Akteure aus der und für die Informatik zu bündeln.

Wie werden sich GI-Mitglieder beteiligen können?

NFDIxCS soll allen in der Informatik-Forschung Tätigen ein Forum für die Diskussion über Formate von Forschungsdaten, Metadaten-Formaten und Semantiken bieten. Gemeinsam wollen wir allgemein akzeptierte Standards, insbesondere für die nachhaltige Speicherung, das Auffinden und Zurverfügungstellen von Informatik-Forschungsdaten erarbeiten und etablieren. Die Fachbereiche und Fachgruppen der GI spielen hier eine wichtige Rolle als Expertinnen und Experten der verschiedensten Sub-Communities mit ihren unterschiedlichen Forschungsmethoden und -daten. Von guten Beispielen können wir fachbereichsübergreifend lernen. Ich wünsche mir, dass sich alle GI-Gliederungen an der Diskussion beteiligen, sich mit bestehenden Ansätzen und Bedarfen einbringen und als Multiplikatoren in ihre Bereiche hineinwirken.

Welche Fragen müssen wir als Erstes adressieren und wo sehen Sie momentan die größten Herausforderungen beim Aufbau der NFDIxCS?

Das Kernziel des Konsortiums NFDIxCS ist es, Dienste zur Speicherung komplexer domänenspezifischer Datenobjekte aus der Breite der Informatik zu identifizieren, zu definieren und schließlich einzusetzen und damit die FAIR-Prinzipien flächendeckend umzusetzen. Das schließt die Produktion wiederverwendbarer Datenobjekte ein, die auch die zugehörigen Metadaten sowie die entsprechende Software, Kontext- und Ausführungsinformationen enthalten. Diese Datenobjekte können von beliebiger Größe, Struktur und Qualität sein. Hier wollen wir unter Nutzung der Container-Technologie ansetzen.

Welchen Beitrag kann die Informatik für die gesamte NFDI leisten?

Wir wollen die Erfahrungen und das Wissen der Informatik-Community zu Systemarchitekturen, Prozessen, Standards für Interoperabilität, datenorientierten Publikations- und Kommunikationssystemen und insbesondere unserem Ansatz des Research Data Management Containers mit allen interessierten Wissenschaftsbereichen und Konsortien in der NFDI-Familie teilen. In Zusammenarbeit mit anderen Disziplinen wollen wir die systematische Anwendung von Informatikmethoden befördern. Nicht zuletzt entstehen im Betrieb dieser Systeme regelmäßig große Datenmengen, die ihrerseits wiederum dazu beitragen, auch genuine Informatikmethoden weiterzuentwickeln. So können hoffentlich alle NFDI-Konsortien voneinander profitieren.

Das Interview führten Julia Meisner und Nikolas Becker. Es erschien zuerst im Jahresbericht 2022/23 der GI, den Sie hier einsehen und downloaden können.

Mehr zum Projekt unter: https://nfdixcs.org/

Porträt von Ulrike Lucke
Daten langfristig zu archivieren und zu pflegen ist für Ulrike Lucke eine zentrale Herausforderung, vor der die Informatik-Community steht.