Seite wählen

Vom „Schritt Null“ zur vollen Reproduzierbarkeit: So ermöglicht DataPLANT konsortienübergreifende Datenanalysen.

Im Forschungsdatenmanagement gilt die sichere Speicherung und Beschreibung von Daten oft als das Ziel. Für Forschende ist dies jedoch nur der „Schritt Null“. Der wahre Wert von Forschungsdaten liegt in ihrer Wiederverwendbarkeit: in der Möglichkeit, Analysen unmittelbar zu reproduzieren oder neue Methoden auf bestehende Datensätze anzuwenden.

Wir von DataPLANT rücken die dynamische Nutzbarkeit in den Fokus und gehen über die statische Archivierung hinaus. Wir nutzen den Annotated Research Context (ARC) nicht nur als Container für Dateien, sondern als Träger für ausführbare Logik. Damit schließt unser Konsortium die Lücke zwischen Datenarchiven und Hochleistungsrechnern (HPC).

Der ARC als digitales Analyse-Rezept

Kern dieser Innovation ist die Integration von Standard-Workflow-Sprachen wie CWL und der Galaxy-Plattform. Jeder ARC enthält einen strukturierten Prozessgraphen – eine Art digitalen Bauplan, der exakt dokumentiert, wie Daten generiert und analysiert wurden. Diese Struktur kann von Rechenplattformen direkt interpretiert werden.

In der Praxis bedeutet dies, dass Forschende einen publizierten Datensatz übernehmen und die Analyse praktisch per „Play“-Knopf erneut ausführen können. Der vollständige Workflow der ursprünglichen Autoren wird automatisch ausgeführt, wodurch echte Reproduzierbarkeit ermöglicht wird und neue Analysen erleichtert werden.

Eine konsortienübergreifende Initiative

Diese Form der Interoperabilität erfordert Standards, die über einzelne Disziplinen hinausgehen. DataPLANT arbeitet deshalb aktiv mit anderen NFDI-Konsortien zusammen, insbesondere mit FAIRagro und Mitgliedern der BioData Interest Group. Gemeinsam stimmen wir die Spezifikationen für unsere Infrastrukturen ab.

Ein föderiertes Ökosystem ohne Hürden

Unser Ziel ist eine vernetzte Forschungslandschaft, in der technische Grenzen verschwinden. Eine Pflanzenwissenschaftlerin soll einen ARC nutzen und die darin enthaltenen Workflows auf einem Galaxy-Server eines anderen Konsortiums oder auf einem lokalen HPC-Cluster ausführen können. Dies geschieht ohne manuellen Transfer von Terabytes an Daten und ohne, dass Code neu geschrieben werden muss.

Durch die Harmonisierung technischer Standards innerhalb der NFDI stellen wir sicher, dass FAIR-Daten mehr als nur auffindbar sind: Sie sind unmittelbar nutzbar, reproduzierbar und bereit für neue wissenschaftliche Erkenntnisse.

Über DataPLANT:

ARCitect Desktop App: 

DataPLANT Knowledge Base:

Galaxy Plant Server:

Galaxy Integration Knowledge Base:

CWL Knowledge Base:

Common Workflow Language (CWL):

Andere Beiträge

Beiträge

Humanities@NFDI: Gemeinsam für nachhaltige Forschungsdaten

Fächerübergreifende Kooperation für den Erhalt des kulturellen Erbes
Die Humanities@NFDI-Initiative vereint vier NFDI-Konsortien, um Forschungsdaten aus den Geistes- und Kulturwissenschaften nachhaltig zugänglich und nachnutzbar zu machen. Durch gemeinsame Standards, Vokabulare und Community-Formate stärkt die Zusammenarbeit die Vernetzung und schafft die Grundlage für interdisziplinäre Forschung.

mehr lesen

QualidataNet von KonsortSWD-NFDI4Society ist der „central point of entry“ für qualitative Daten und ihre Nachnachnutzung

QualidataNet – Gemeinsam qualitative Forschungsdaten sichtbar und nutzbar machen
QualidataNet ist der zentrale Zugangspunkt für die Nachnutzung, Archivierung und das Forschungsdatenmanagement qualitativer Forschungsdaten. Über das Suchportal werden qualitative Daten verschiedener Anbieter sichtbar und auffindbar gemacht. Mit praxisnahen Handreichungen, Tools wie dem Open-Source-Anonymisierungstool QualiAnon sowie internationaler Standardisierungsarbeit unterstützt QualidataNet Forschende, Lehrende und Institutionen im Umgang mit qualitativen Daten. Gleichzeitig stärkt das Netzwerk Austausch, Kooperation und die Kultur der Datennachnutzung innerhalb der Community.

mehr lesen

Forum4MICA – Making Information Commonly Available (KonsortSWD I NFDI4Society)

Forum4MICA – Wissen zu Forschungsdaten gemeinsam zugänglich machen
Forum4MICA bündelt Informationen zu Forschungsdaten aus den Sozial-, Verhaltens-, Bildungs- und Wirtschaftswissenschaften auf einer zentralen Plattform. Forschende können dort Fragen zu komplexen Datensätzen stellen, Antworten von Expert:innen aus Forschungsdatenzentren erhalten und sich mit der Community austauschen. So entsteht ein nachhaltiges Wissensarchiv für Forschungsdatenmanagement und wissenschaftliche Vernetzung.

mehr lesen