DataPLANT schließt die Lücke zwischen komplexen Datenstandards und dem Forschungsalltag.
Die technische Einstiegsbarriere bleibt eine der größten Hürden im Forschungsdatenmanagement (FDM). Viele Forschende unterstützen die Idee von FAIR-Daten, stehen in der Praxis jedoch vor komplexen Metadatenstandards, JSON-Dateien und technischen Protokollen, die weit von ihrer täglichen Arbeit im Labor oder im Feld entfernt sind.
Wir von DataPLANT begegnen dieser Herausforderung direkt. Wir betrachten Wissenschaftler als „Content Creator“ und nicht als Datentechniker. Unsere Lösung ist der Annotated Research Context (ARC). Dieses standardisierte und dennoch flexible Paket bündelt Forschungsdaten, Metadaten und Workflow-Beschreibungen. Bereits mehr als 2.000 ARCs wurden von der Community erstellt und zeigen die breite Akzeptanz dieses Ansatzes in der Pflanzenforschung.
Der ARC baut direkt auf dem internationalen RO-Crate-Standard auf. DataPLANT hat dieses Basiskonzept zu einem praxisnahen Werkzeug weiterentwickelt, das speziell auf die Anforderungen der Pflanzenforschung zugeschnitten ist.
Komplexität einfach handhaben
Wir verlangen von Forschenden nicht, Programmiercode zu schreiben, um ihre Daten FAIR zu gestalten. Stattdessen bietet DataPLANT intuitive Werkzeuge wie den ARCitect. Damit strukturieren Sie Ihre Forschung in vertrauten Formaten, beispielsweise über Tabellenkalkulationen mit kontrollierten Vokabularen. Der ARC fungiert dabei als Gerüst: Er übersetzt Ihre Eingaben im Hintergrund automatisch in standardkonforme Metadaten (RO-Crate). So können sich Forschende auf die Dokumentation ihrer Experimente konzentrieren, ohne sich mit technischen Datenformaten beschäftigen zu müssen.
Praxisnahe Umsetzung
Ein aktueller Meilenstein transformiert den ARC von einem statischen Speicherformat in ein aktives Publikationsmodell. Durch die neue Integration in die Invenio-Plattform ermöglicht DataPLANT die erste „echte“ Datenpublikation. Hierbei wird das FAIR Digital Object (FDO) nicht nur archiviert, sondern direkt visualisiert und nutzbar gemacht.
Den Kern dieser Innovation bildet der Data Storage Resolver. Dieser Mechanismus trennt den persistenten Publikationsdatensatz von dem physischen Speicherort der Daten. Es spielt keine Rolle, ob die umfangreichen Rohdaten in einem S3-Bucket bei DataPLANT liegen, an das European Nucleotide Archive (ENA) übertragen werden oder auf einem lokalen HPC-Cluster verbleiben. Der Publikationsdatensatz bleibt stabil und gültig.
Diese Transparenz stellt sicher, dass Daten auffindbar und zugänglich (FAIR) bleiben – unabhängig davon, wo sie physisch gespeichert sind. Dadurch werden Datenpublikationen robust gegenüber sich verändernden Speicher- und Infrastrukturumgebungen.
Durch die Kombination aus anwenderfreundlichen Werkzeugen und einem leistungsstarken, dezentralen Backend macht DataPLANT das abstrakte Konzept der FDOs für die Pflanzenforschung zur gelebten Praxis.
Über DataPLANT:
- https://nfdi4plants.org/
- Information zu DataPLANT und dem ARC-Infrastruktur
ARCitect Desktop App:
- https://github.com/nfdi4plants/ARCitect
- Grafisches Interface zur Erstellung von ARCs
DataPLANT Knowledge Base:
- https://nfdi4plants.github.io/nfdi4plants.knowledgebase/
- Schritt-für-Schritt-Anleitungen zur Erstellung eines ARCs
Was ist RO-Crate?
- https://www.researchobject.org/ro-crate/
- Hintergrundinformationen zum zugrunde liegenden Standard
Invenio Publication Portal:
- https://archive.nfdi4plants.org/
- Durchsuchen und Publizieren von ARCs als FAIR Digital Objects
Andere Beiträge
Gesteigerte FAIRness durch einfache Nutzung standardisierter Begriffe: TS4NFDI in RADAR (Base4NFDI)
Im Rahmen eines Inkubatorprojekts wurde der Basisdienst TS4NFDI in das disziplinübergreifende Forschungsdaten-Repositorium RADAR, sowie die darauf aufbauenden Fachdienste RADAR4Chem, RADAR4Culture und RADAR4Memory integriert. Ziel war es, die Metadatenbeschreibung...
Repo4Cat – hilft dabei, Forschungsdaten aus katalysebezogenen Wissenschaften zu speichern, zu beschreiben und zu veröffentlichen (NFDI4Cat)
Repo4Cat bietet eine zentrale Plattform für das Speichern, Teilen und Veröffentlichen von Katalysedaten und begleitet Nutzende von der Datensuche bis zur Veröffentlichung. Mit FAIR-konformer Datenhaltung, kollaborativen Arbeitsbereichen und umfassendem Support stärkt es die nachhaltige Nutzung und Wiederverwendbarkeit von Forschungsdaten.
PUNCH4NFDI-Infrastruktur meistert Stress-Test mit Astronomie-Daten
PUNCH4NFDI erreichte 2025 einen Meilenstein mit einer groß angelegten Datenanalyse auf föderierter Infrastruktur. Mit Tausenden CPU-Kernen wurden stellare Parameter berechnet und die Leistungsfähigkeit von Compute4PUNCH und REANA eindrucksvoll demonstriert.
Recent Comments