Sektion (Meta)daten, Termino­­lo­gien, Provenienz

Über uns

Damit Forschungsdaten gefunden und effizient nachgenutzt werden können, müssen diese mit Metadaten beschrieben werden. Metadaten sind Informationen über die Daten, z.B. über die Forschenden, die Daten erhoben haben oder über die Lizenz, unter der die Daten genutzt werden dürfen.

Die Sektion unterstützt Prozesse der NFDI-Konsortien bei der gemeinsamen Erarbeitung und Etablierung geteilter Daten- und Metadatenstandards als Grundlage für eine effektive Nachnutzung von Forschungsdaten entsprechend den FAIR-Prinzipien.

Um Daten aus verschiedenen Quellen interdisziplinär verknüpfen zu können, sollen in NFDI semantische Technologien (Ontologien, Knowledge Graphs) eingebunden werden, die es ermöglichen, Wissen und Informationen in maschinenlesbarer Form zu generieren. Einheitliche Dokumentationsverfahren werden den Entstehungs- und Verarbeitungskontext (Provenienz) von Daten transparent machen.

Im Themenbereich Metadaten und Forschungsdaten beschäftigt sich die Sektion mit Fragen zur (Meta-)daten-Harmonisierung, zur Auffindbarkeit von Daten, zu allgemeinen Daten- und Metadaten-Standards mit Blick auf ein mögliches NFDI-Kernmetadatenformat sowie Formatumwandlungen und Persistent-Identifier-Systemen.

Im Themenbereich Terminologien beschäftigt sich die Sektion mit community- und disziplinenübergreifenden Definitionen von Top-Level Ontologien und Mappings von Ontologien sowie Best Practices zur Modellierung von Terminologien, Vokabularen und Ontologien sowie darauf aufbauenden Diensten zur Datenintegration.

Im Themenbereich Provenienz wird sich die Sektion mit rechtlichen, technischen und kulturellen Aspekten des Entstehungskontextes von (Meta)daten beschäftigen und Vorschläge für einheitliche und nachvollziehbare Dokumentationsverfahren zur Beantwortung der Fragen nach dem was, wo, wann, wer, wie und warum der Datenerzeugung und Datenprozessierung entwerfen.

Die Sektion wird in enger Rückkopplung mit den Sektionen “Common Infrastructures” sowie “Ethical, Social and Legal Aspects” insbesondere die Themenbereiche Terminologien und Provenienz bearbeiten.

Ziele

Die Sektion integriert alle Konsortien und Communities und strebt die Vernetzung und Harmonisierung der Entwicklungen in Konsortien an, die in den Themenbereichen der Sektion mit ähnlichen Datenstrukturen, Standards und Werkzeugen arbeiten und damit ähnliche Ziele verfolgen:

  • Kooperative Definition von Top-Level Ontologien / Mapping von Ontologien
  • Konzepte und Empfehlungen für die Harmonisierung von (Meta)daten- und Terminologie-Diensten für die NFDI und darüber hinaus
  • Definition von disziplinübergreifenden Minimum Information Standards / Metadaten für die durch NFDI vertretenen wissenschaftlichen Disziplinen
  • Entwicklung von Konzepten zur Annotierung von Metadatenelementen mit Konzepten aus Terminologien
  • Überblick und Evaluierung von existierenden Ansätzen und (emerging) best practices, Harmonisierung von Schnittstellen

Die Sektion bereitet somit den Weg für die Nutzung von Synergien bei der Entwicklung domänenunabhängiger Metadatenstandards sowie für die Nutzung von Infrastruktur und schafft Anknüpfungspunkte für die fachliche Integration und Validierung von Basisdiensten.

Arbeitsgruppen

Cookbooks, Guidance and Best Practice

Forschende brauchen auf ihre spezifischen Bedürfnisse zugeschnittene Hilfestellungen bei der Ermittlung und Anwendung von Standards und Werkzeugen für (Meta)Daten, Terminologien und Provenienz. Jedes NFDI-Konsortium identifiziert, sammelt und entwickelt Ansätze, die für Forschungsaktivitäten außerhalb der einzelnen Domänen relevant sein könnten. Die Arbeitsgruppe „Cookbooks, Guidance, and Best Practices“ zielt darauf ab, Konzepte, Arbeitsabläufe und bewährte Praktiken der Konsortien zu diesen Themen zu identifizieren, zu sammeln, auszutauschen und gegebenenfalls zu harmonisieren und wird darüber hinaus Strategien zur Förderung der Produktion und Bereitstellung hochwertiger Metadaten entwickeln.

Kontakt: Susanne Arndt

Terminology Services

Das Kernstück FAIRer Metadaten für die Verwaltung von Forschungsdaten (RDM) sind Terminologien. Terminologien weisen verschiedene Merkmale auf: Sie beschreiben Domänenwissen (z. B. verwenden Chemie, Biologie oder Informationswissenschaft ihre eigenen Terminologien) und sie entwickeln sich im Laufe der Zeit ständig weiter und müssen in ihrer Wissensdomäne und darüber hinaus akzeptiert und abgestimmt werden (gemappt). Das übergeordnete Ziel der Arbeitsgruppe „Terminology Services“ ist es, gemeinsame Entwicklungen voranzutreiben, Best Practises zu teilen und die Hürden für die Verwendung von Terminologien zu reduzieren.

Kontakt: Roman Baum

Ontology Harmonization and Mapping

Der konsistente Gebrauch von Terminologien und die Organisation von Begriffen in strukturierten Ontologien sind notwendige Voraussetzungen für FAIRe Daten, insbesondere für ihre Nachnutzung durch andere wissenschaftliche Communitys und Ausführbarkeit durch Maschinen. Jedes Forschungsfeld bringt eigene, seine Bedarfe widerspiegelnde Terminologien ein. Dabei wird es konzeptionelle Überschneidungen und – wie in natürlicher Sprache – mehr als eine Möglichkeit geben, Sachverhalte auszudrücken. Harmonisierung zielt auf die Vereinbarung, sich hin zu einer gemeinsamen Terminologie zu entwickeln, während beim Mapping eine eindeutig definierte Abbildung als Schnittstelle zwischen getrennt bleibenden Terminologien vereinbart wird. Die Arbeitsgruppe wird diese für die Verknüpfung von Forschungsdaten essentielle Arbeit koordinieren.

Kontakt: Philip Strömert 

Search and Harvesting

Diese Arbeitsgruppe konzentriert sich darauf, wie (Meta-)Daten extrahiert, gefunden und genutzt werden können, und zwar sowohl für die Entdeckung und Nutzung von Daten durch Forscher (Search/Discovery) als auch für die Aggregation und Indexierung durch Suchdienste (Harvesting). In beiden Fällen – Suche und Harvesting – können die Akteure Menschen oder Maschinen sein.

Kontakt:  Brigitte Mathiak, Heinrich Widmann

Knowledge Graphs

Wissensgraphen sind eine Schlüsseltechnologie um die FAIR-Prinzipien in Dateninfrastrukturen zu implementieren und Dateninteroperabilität sowohl in automatisierten Datenflüssen als auch für Datenendnutzer zu gewährleisten. Die Aktivitäten der Arbeitsgruppe Wissensgraphen zielen auf die Förderung der Nutzung von Wissensgraphen in den Konsortien der NFDI, auf die domänenübergreifende Integration verteilter Daten unter Beachtung der FAIR-Prinzipien sowie auf Beiträge zur gemeinsamen Entwicklung von Werkzeugen und Technologien, die die Transformation von Daten hin zu semantisch nutzbarem Wissen über verschiedene Wissensdomänen hinweg ermöglichen, ab.

Kontakt: Renat Shigapov, Lozana Rossenova, Moritz Schubotz

Research Software Metadata

Forschungssoftware wird in vielen Bereichen der Wissenschaft zur Forschung genutzt und stellt teilweise selbst ein Forschungsobjekt dar. Viele NFDI-Konsortien decken Forschungssoftware als wichtiges Forschungsartefakt mit ab und wollen, dass Forschungssoftware in Zukunft die FAIR-Kriterien erfüllt, um die Transparenz, Reproduzierbarkeit und Wiederverwendbarkeit in software-basierter Forschung zu erhöhen. Damit Forschungssoftware die FAIR-Kriterien erfüllt, muss sie mit aussagekräftigen und interoperablen Metadaten beschrieben werden. Dafür werden entsprechende Metadatenschemata benötigt. Es gibt zwar einige Metadatenschemata für Forschungssoftware, z. B. CodeMeta, aber sie weisen einige Einschränkungen auf, z. B. fehlende Elemente und fehlende semantische Interoperabilität. Um diese Probleme zu beheben, hat sich diese Arbeitsgruppe zum Ziel gesetzt, ein umfassendes Metadatenvokabular für Forschungssoftware bereitzustellen, das mit bestehenden Standards wie schema.org und CodeMeta kompatibel ist. Damit wird die Arbeitsgruppe alle NFDI-Konsortien bei der Anwendung und Etablierung von Metadatenschemeta für Forschungssoftware unterstützen, z.B. bei Entwicklung von bereichsspezifischen Erweiterungen.

Kontakt: Stephan Ferenz, Leyla Jael Castro

Oliver Koepler

Sprecher: Dr. Oliver Koepler

(TIB – Leibniz Information Centre for Science and Technology University Library)

Brigitte Mathiak

Stellv. Sprecherin: Dr. Brigitte Mathiak 

(GESIS – Leibniz Institute for Social Sciences e.V.)

Beteiligte Mitgliedsorganisationen
  • Akademie der Wissenschaften Hamburg
  • Akademie der Wissenschaften und der Literatur Mainz
  • Akademie der Wissenschaften zu Göttingen
  • Bayerische Akademie der Wissenschaften
  • Bayerische Staatsbibliothek
  • Berlin-Brandenburgische Akademie der Wissenschaften (BBAW)
  • Bundesverband Theatersammlungen in Deutschland (TheSiD) e.V.
  • Carl von Ossietzky Universität Oldenburg
  • Christian-Albrechts-Universität zu Kiel
  • Deutsche Nationalbibliothek
  • Deutsche Zentralbibliothek für Medizin (ZB MED) – Informationszentrum Lebenswissenschaften
  • Deutsches Archäologisches Institut (DAI)
  • Deutsches Elektronen-Synchrotron DESY
  • Deutsches Klimarechenzentrum GmbH
  • Deutsches Primatenzentrum GmbH – Leibniz-Institut für Primatenforschung
  • Deutsches Zentrum für Hochschul- und Wissenschaftsforschung GmbH (DZHW)
  • Deutsches Zentrum für Luft- und Raumfahrt (DLR)
  • digiCULT-Verbund eG
  • DIPF Leibniz-Institut für Bildungsforschung und Bildungsinformation
  • Eberhard Karls Universität Tübingen
  • FAIR-DI e.V.
  • FernUniversität in Hagen
  • FIZ Karlsruhe – Leibniz-Institut für Informationsinfrastruktur GmbH
  • Forschungszentrum Jülich GmbH
  • Freie Universität Berlin
  • Friedrich-Schiller-Universität Jena
  • GEOMAR Helmholtz-Zentrum für Ozeanforschung Kiel
  • Georg-August-Universität Göttingen
  • Germanisches Nationalmuseum – Leibniz-Forschungsmuseum für Kulturgeschichte (GNM)
  • Gesellschaft für Biologische Daten e.V. (GFBio e.V.)
  • Gesellschaft für Informatik e. V.
  • GESIS – Leibniz-Institut für Sozialwissenschaften e.V.
  • Heidelberger Akademie der Wissenschaften
  • Helmholtz Zentrum für Infektionsforschung
  • Helmholtz-Zentrum für Umweltforschung GmbH – UFZ
  • Helmholtz-Zentrum Hereon
  • Herzog August Bibliothek Wolfenbüttel
  • HITS gGmbH
  • Humboldt-Universität zu Berlin
  • IAML – Deutschland e. V.
  • Innovationszentrum für Prozessdatentechnik (Inprodat) e.V.
  • Internationales Quellenlexikon der Musik e. V.
  • Karlsruher Institut für Technologie
  • Klassik Stiftung Weimar
  • Leibniz-Institut DSMZ-Deutsche Sammlung von Mikroorganismen und Zellkulturen GmbH
  • Leibniz-Institut für Agrarlandschaftsforschung (ZALF) e.V.
  • Leibniz-Institut für Astrophysik Potsdam (AIP)
  • Leibniz-Institut für Bildungsverläufe (LIfBi) e.V.
  • Leibniz-Institut für Deutsche Sprache (IDS)
  • Leibniz-Institut für Katalyse e.V.
  • Leibniz-Institut für Maritime Geschichte
  • Leibniz-Institut für Pflanzenbiochemie
  • Leibniz-Institut für Pflanzengenetik und Kulturpflanzenforschung
  • Leibniz-Institut für Photonische Technologien e.V. (IPHT)
  • Leibniz-Institut für Plasmaforschung und Technologie e.V. (INP)
  • Leibniz-Zentrum für Archäologie (LEIZA)
  • Ludwig-Maximilians-Universität München
  • Martin-Luther-Universität Halle-Wittenberg
  • Max Weber Stiftung – Deutsche Geisteswissenschaftliche Institute im Ausland
  • Museum für Naturkunde – Leibniz-Institut für Evolutions- und Biodiversitätsforschung
  • OFFIS e.V.
  • Otto-Friedrich-Universität Bamberg
  • Philipps-Universität Marburg
  • Physikalisch-Technische Bundesanstalt
  • Sächsische Akademie der Wissenschaften Leipzig
  • Senckenberg Gesellschaft für Naturforschung
  • Technische Hochschule Köln
  • Technische Universität Berlin
  • Technische Universität Braunschweig
  • Technische Universität Darmstadt
  • Technische Universität Dortmund
  • Technische Universität Dresden
  • Technische Universität Kaiserslautern
  • TIB – Leibniz-Informationszentrum Technik und Naturwissenschaften und Universitätsbibliothek
  • Universität Bielefeld
  • Universität Bremen
  • Universität der Künste Berlin
  • Universität Duisburg-Essen
  • Universität Leipzig
  • Universität Mannheim
  • Universität Paderborn
  • Universität Stuttgart
  • Universitätsmedizin Greifswald KdöR
  • Verbundzentrale des GBV (VZG)
  • Verein für Computergenealogie e.V.
  • Westfälische Wilhelms-Universität Münster (WWU)
  • Zoologisches Forschungsmuseum Alexander Koenig – Leibniz-Institut für Biodiversität der Tiere
Beteiligte Personen
  • Volker Adam
  • Ivonne Anders
  • Tobias Arera-Rütenik
  • Christian Aßmann
  • Nagaraj Bahubali Asundi
  • Linda Baldewein
  • Markus Becker
  • Renate Behrens
  • Alexander Berg-Weiß
  • Noemi Betancort
  • Mirjam Blümm
  • Thomas Bocklitz
  • Christian Bölling
  • Christian Bonatto Minella
  • Zeyd Boukhers
  • David Broneske
  • Torsten Bronger
  • Björn Brötz
  • Jan Bumberger
  • Boyke Bunk
  • Silvia Chiacchiera
  • Andreas Christ
  • Philipp Cimiano
  • Roberto Cozatl
  • Andreas Czerniak
  • Andreas Daniel
  • Silvia Daniel 
  • Michael Denker
  • Jürgen Diet
  • Stephan Dörschel
  • Frank Dührkohp
  • Dr. Ulrike Ehmig
  • Harry Enke
  • Stephan Ferenz
  • Michael Finkel
  • Juliane Fluck
  • Konrad Förstner
  • Andreas Frech
  • Fabian Fricke
  • Marc Fuhrmans
  • Christoph Garth
  • Eva-Maria Gerstner
  • Luca Ghiringhelli
  • Martin Golebiewski
  • Sandra Göller
  • Jonas Grieb
  • Peter Grobe
  • Matthias Grönewald
  • Stephan Hachinger
  • Hamideh Hajiabadi
  • Michael Hanke
  • Nicolas Hayen
  • Felix Henninger
  • Christin Henzen
  • Gerhard Heyer
  • Christian Himpe
  • Julian Hniopek
  • Volker Hofmann
  • Timothy Holbrook
  • Dorothea Iglezakis
  • Holger Israel
  • Ariane Jeßulat
  • Angela Kailus
  • Naouel Karam
  • Ashish Karmacharya
  • Bhavin Katabathuni
  • Jürgen Kett
  • Mohammad Khatamirad
  • Wibke Kleina
  • Paul Klemm
  • Olaf Kletke
  • Birgitta König-Ries
  • Oliver Koepler
  • Chantal Köppl
  • Anne Koziolek
  • Angela Kranz
  • Susanne Kunis
  • Alessandra Kuntz
  • Herbert Lange
  • Elfrun Lehmann
  • Timm Lehmberg
  • Johannes Liermann
  • David Linke
  • Brigitte Mathiak
  • Juliane Menger
  • Katrin Moeller
  • Robert Nasarek
  • Steffen Neumann
  • Dennis Niewerth
  • Taras Petrenko
  • Judith Pfeiffer
  • Klaus Pietschmann
  • Andre Pirralha
  • Renate Polak-Bennemann
  • Etienne Posthumus
  • Dagmar Quandt
  • Andreas Redelbach
  • Stephanie Rehwald
  • Lorenz Reimer
  • Elena Rey Mazón
  • Thomas Richter
  • Xenia Ritter
  • Raphael Ritz
  • Thomas Rose
  • Daniel Röwenstrunk
  • Harald Sack
  • Stefan Sandfeld
  • Kristin Sauerland
  • Björn Schembera
  • Hansjörg Scherberger
  • Gunther Schiefer
  • Sirko Schindler
  • Carsten Schmidt
  • Markus Schnöpf
  • Thomas Schörner
  • Torsten Schrade
  • Daniela Schulz
  • Jan Sören Schwarz
  • Renat Shigapov
  • Emanuel Söding
  • Xenia Specka
  • Arnost Stanzel
  • Regine Stein
  • Rainer Stotzka
  • Martin Stricker
  • Dieta Svoboda-Baas
  • Dzulia Terzijska
  • Suvasini Thangaraj
  • Florian Thiery
  • Victoria Tokareva
  • Thorsten Trippel
  • Björn Usadel
  • Axel Vitzthum
  • Frank Weber
  • Amanda Wein
  • Dirk Weisbrod
  • Oliver Werth
  • Jörg Wettlaufer
  • Heinrich Widmann
  • Rebecca Wilm
  • Dirk Wintergrün
  • Atinkut Alamirrew Zeleke