Sektion (Meta)daten, Termino­­lo­gien, Provenienz

Über uns

Damit Forschungsdaten gefunden und effizient nachgenutzt werden können, müssen diese mit Metadaten beschrieben werden. Metadaten sind Informationen über die Daten, z.B. über die Forschenden, die Daten erhoben haben oder über die Lizenz, unter der die Daten genutzt werden dürfen.

Die Sektion unterstützt Prozesse der Konsortien der NFDI bei der gemeinsamen Erarbeitung und Etablierung geteilter Daten- und Metadatenstandards als Grundlage für eine effektive Nachnutzung von Forschungsdaten entsprechend den FAIR-Prinzipien.

Um Daten aus verschiedenen Quellen interdisziplinär verknüpfen zu können, sollen in der NFDI semantische Technologien (Ontologien, Knowledge Graphs) eingebunden werden, die es ermöglichen, Wissen und Informationen in maschinenlesbarer Form zu genieren. Einheitliche Dokumentationsverfahren werden den Entstehungs- und Verarbeitungskontext (Provenienz) von Daten transparent machen.

Im Themenbereich Metadaten und Forschungsdaten beschäftigt sich die Sektion mit Fragen zur (Meta-)daten-Harmonisierung, zur Auffindbarkeit von Daten, zu allgemeinen Daten- und Metadaten-Standards mit Blick auf ein mögliches NFDI-Kernmetadatenformat sowie Formatumwandlungen und Persistent-Identifier-Systemen.

Im Themenbereich Terminologien beschäftigt sich die Sektion mit community- und disziplinenübergreifenden Definitionen von Top-Level Ontologien und Mappings von Ontologien sowie Best Practices zur Modellierung von Terminologien, Vokabularen und Ontologien sowie darauf aufbauenden Diensten zur Datenintegration.

Im Themenbereich Provenienz wird sich die Sektion mit rechtlichen, technischen und kulturellen Aspekten des Entstehungskontextes von (Meta)daten beschäften und Vorschläge für einheitliche und nachvollziehbare Dokumentationsverfahren zur Beantwortung der Fragen nach dem was, wo, wann, wer, wie und warum der Datenerzeugung und Datenprozessierung entwerfen.

Die Sektion wird in enger Rückkopplung mit den Sektionen “Common Infrastructures” sowie “Ethical, Social and Legal Aspects” insbesondere die Themenbereiche Terminologien und Provenienz bearbeiten.

Ziele

Die Sektion integriert alle Konsortien und Communities und strebt die Vernetzung und Harmonisierung der Entwicklungen in Konsortien an, die in den Themenbereichen der Sektion mit ähnlichen Datenstrukturen, Standards und Werkzeugen arbeiten und damit ähnliche Ziele verfolgen:

  • Kooperative Definition von Top-Level Ontologien / Mapping von Ontologien
  • Konzepte und Empfehlungen für die Harmonisierung von (Meta)daten- und Terminologie-Diensten für die NFDI und darüber hinaus
  • Definition von disziplinübergreifenden Minimum Information Standards / Metadaten für die durch NFDI vertretenen wissenschaftlichen Disziplinen
  • Entwicklung von Konzepten zur Annotierung von Metadatenelementen mit Konzepten aus Terminologien
  • Überblick und Evaluierung von existierenden Ansätzen und (emerging) best practices, Harmonisierung von Schnittstellen

Die Sektion bereitet somit den Weg für die Nutzung von Synergien bei der Entwicklung domänenunabhängiger Metadatenstandards sowie für die Nutzung von Infrastruktur und schafft Anknüpfungspunkte für die fachliche Integration und Validierung von Basisdiensten.

Arbeitsgruppen

Cookbooks, Guidance and Best Practice

Forschende brauchen auf ihre spezifischen Bedürfnisse zugeschnittene Hilfestellungen bei der Ermittlung und Anwendung von Standards und Werkzeugen für (Meta)Daten, Terminologien und Provenienz. Jedes NFDI-Konsortium identifiziert, sammelt und entwickelt Ansätze, die für Forschungsaktivitäten außerhalb der einzelnen Domänen relevant sein könnten. Die Arbeitsgruppe „Cookbooks, Guidance, and Best Practices“ zielt darauf ab, Konzepte, Arbeitsabläufe und bewährte Praktiken der Konsortien zu diesen Themen zu identifizieren, zu sammeln, auszutauschen und gegebenenfalls zu harmonisieren und wird darüber hinaus Strategien zur Förderung der Produktion und Bereitstellung hochwertiger Metadaten entwickeln.

Kontakt: Susanne Arndt

Terminology Services

Das Kernstück FAIRer Metadaten für die Verwaltung von Forschungsdaten (RDM) sind Terminologien. Terminologien weisen verschiedene Merkmale auf: Sie beschreiben Domänenwissen (z. B. verwenden Chemie, Biologie oder Informationswissenschaft ihre eigenen Terminologien) und sie entwickeln sich im Laufe der Zeit ständig weiter und müssen in ihrer Wissensdomäne und darüber hinaus akzeptiert und abgestimmt werden (gemappt). Das übergeordnete Ziel der Arbeitsgruppe „Terminology Services“ ist es, gemeinsame Entwicklungen voranzutreiben, Best Practises zu teilen und die Hürden für die Verwendung von Terminologien zu reduzieren.

Kontakt: Roman Baum

Ontology Harmonization and Mapping

Der konsistente Gebrauch von Terminologien und die Organisation von Begriffen in strukturierten Ontologien sind notwendige Voraussetzungen für FAIRe Daten, insbesondere für ihre Nachnutzung durch andere wissenschaftliche Communitys und Ausführbarkeit durch Maschinen. Jedes Forschungsfeld bringt eigene, seine Bedarfe widerspiegelnde Terminologien ein. Dabei wird es konzeptionelle Überschneidungen und – wie in natürlicher Sprache – mehr als eine Möglichkeit geben, Sachverhalte auszudrücken. Harmonisierung zielt auf die Vereinbarung, sich hin zu einer gemeinsamen Terminologie zu entwickeln, während beim Mapping eine eindeutig definierte Abbildung als Schnittstelle zwischen getrennt bleibenden Terminologien vereinbart wird. Die Arbeitsgruppe wird diese für die Verknüpfung von Forschungsdaten essentielle Arbeit koordinieren.

Kontakt: Holger Israel

Search and Harvesting

Diese Arbeitsgruppe konzentriert sich darauf, wie (Meta-)Daten extrahiert, gefunden und genutzt werden können, und zwar sowohl für die Entdeckung und Nutzung von Daten durch Forscher (Search/Discovery) als auch für die Aggregation und Indexierung durch Suchdienste (Harvesting). In beiden Fällen – Suche und Harvesting – können die Akteure Menschen oder Maschinen sein.

Kontakt:  Brigitte Mathiak, Heinrich Widmann

Knowledge Graphs

Wissensgraphen sind eine Schlüsseltechnologie um die FAIR-Prinzipien in Dateninfrastrukturen zu implementieren und Dateninteroperabilität sowohl in automatisierten Datenflüssen als auch für Datenendnutzer zu gewährleisten. Die Aktivitäten der Arbeitsgruppe Wissensgraphen zielen auf die Förderung der Nutzung von Wissensgraphen in den Konsortien der NFDI, auf die domänenübergreifende Integration verteilter Daten unter Beachtung der FAIR-Prinzipien sowie auf Beiträge zur gemeinsamen Entwicklung von Werkzeugen und Technologien, die die Transformation von Daten hin zu semantisch nutzbarem Wissen über verschiedene Wissensdomänen hinweg ermöglichen, ab.

Kontakt:  Lozana Rossenova, Renat Shigapov, Christian Bölling, Moritz Schubotz

Oliver Koepler

Sprecher: Dr. Oliver Koepler

(TIB – Leibniz Information Centre for Science and Technology University Library)

Brigitte Mathiak

Stellv. Sprecherin: Dr. Brigitte Mathiak 

(GESIS – Leibniz Institute for Social Sciences e.V.)

Beteiligte Mitgliedsorganisationen
  • Akademie der Wissenschaften und der Literatur Mainz
  • Akademie der Wissenschaften zu Göttingen
  • Bayerische Akademie der Wissenschaften
  • Bayerische Staatsbibliothek
  • Bundesverband Theatersammlungen in Deutschland (TheSiD) e.V.
  • Christian-Albrechts-Universität zu Kiel
  • Deutsche Nationalbibliothek
  • Deutsche Zentralbibliothek für Medizin (ZB MED) – Informationszentrum Lebenswissenschaften
  • Deutsches Elektronen-Synchrotron DESY
  • Deutsches Klimarechenzentrum GmbH
  • Deutsches Primatenzentrum GmbH – Leibniz-Institut für Primatenforschung
  • Deutsches Zentrum für Hochschul- und Wissenschaftsforschung GmbH (DZHW)
  • Deutsches Zentrum für Luft- und Raumfahrt (DLR)
  • digiCULT-Verbund eG
  • DIPF Leibniz-Institut für Bildungsforschung und Bildungsinformation
  • Eberhard Karls Universität Tübingen
  • FAIR-DI e.V.
  • FernUniversität in Hagen
  • FIZ Karlsruhe – Leibniz-Institut für Informationsinfrastruktur GmbH
  • Forschungszentrum Jülich GmbH
  • Freie Universität Berlin
  • Friedrich-Schiller-Universität Jena
  • GEOMAR Helmholtz-Zentrum für Ozeanforschung Kiel
  • Georg-August-Universität Göttingen
  • Germanisches Nationalmuseum – Leibniz-Forschungsmuseum für Kulturgeschichte (GNM)
  • Gesellschaft für Biologische Daten e.V. (GFBio e.V.)
  • Gesellschaft für Informatik e. V.
  • GESIS – Leibniz-Institut für Sozialwissenschaften e.V.
  • Heidelberger Akademie der Wissenschaften
  • Helmholtz Zentrum für Infektionsforschung
  • Helmholtz-Zentrum für Umweltforschung GmbH – UFZ
  • Helmholtz-Zentrum Hereon
  • Herzog August Bibliothek Wolfenbüttel
  • HITS gGmbH
  • Humboldt-Universität zu Berlin
  • IAML – Deutschland e. V.
  • Innovationszentrum für Prozessdatentechnik (Inprodat) e.V.
  • Internationales Quellenlexikon der Musik e. V.
  • Karlsruher Institut für Technologie
  • Klassik Stiftung Weimar
  • Leibniz-Institut DSMZ-Deutsche Sammlung von Mikroorganismen und Zellkulturen GmbH
  • Leibniz-Institut für Agrarlandschaftsforschung (ZALF) e.V.
  • Leibniz-Institut für Astrophysik Potsdam (AIP)
  • Leibniz-Institut für Bildungsverläufe (LIfBi) e.V.
  • Leibniz-Institut für Deutsche Sprache (IDS)
  • Leibniz-Institut für Katalyse e.V.
  • Leibniz-Institut für Maritime Geschichte
  • Leibniz-Institut für Pflanzenbiochemie
  • Leibniz-Institut für Photonische Technologien e.V. (IPHT)
  • Ludwig-Maximilians-Universität München
  • Martin-Luther-Universität Halle-Wittenberg
  • Max Weber Stiftung – Deutsche Geisteswissenschaftliche Institute im Ausland
  • Otto-Friedrich-Universität Bamberg
  • Philipps-Universität Marburg
  • Physikalisch-Technische Bundesanstalt
  • Technische Hochschule Köln
  • Technische Universität Braunschweig
  • Technische Universität Darmstadt
  • Technische Universität Dortmund
  • Technische Universität Dresden
  • Technische Universität Kaiserslautern
  • TIB – Leibniz-Informationszentrum Technik und Naturwissenschaften und Universitätsbibliothek
  • Universität Bielefeld
  • Universität Bremen
  • Universität der Künste Berlin
  • Universität Duisburg-Essen
  • Universität Leipzig
  • Universität Mannheim
  • Universität Paderborn
  • Universität Stuttgart
  • Universitätsmedizin Greifswald KdöR
  • Verbundzentrale des GBV (VZG)
  • Verein für Computergenealogie e.V.
  • Westfälische Wilhelms-Universität Münster (WWU)
  • Zoologisches Forschungsmuseum Alexander Koenig – Leibniz-Institut für Biodiversität der Tiere
Beteiligte Personen
  • Volker Adam
  • Ivonne Anders
  • Tobias Arera-Rütenik
  • Christian Aßmann
  • Linda Baldewein
  • Renate Behrens
  • Alexander Berg-Weiß
  • Noemi Betancort
  • Mirjam Blümm
  • Thomas Bocklitz
  • Christian Bonatto Minella
  • David Broneske
  • Torsten Bronger
  • Björn Brötz
  • Jan Bumberger
  • Boyke Bunk
  • Silvia Chiacchiera
  • Andreas Christ
  • Philipp Cimiano
  • Roberto Cozatl
  • Andreas Daniel
  • Silvia Daniel
  • Michael Denker
  • Jürgen Diet
  • Stephan Dörschel
  • Frank Dührkohp
  • Ulrike Ehmig
  • Harry Enke
  • Michael Finkel
  • Juliane Fluck
  • Konrad Förstner
  • Andreas Frech
  • Marc Fuhrmans
  • Christoph Garth
  • Eva-Maria Gerstner
  • Luca Ghiringhelli
  • Martin Golebiewski
  • Sandra Göller
  • Peter Grobe
  • Matthias Grönewald
  • Stephan Hachinger
  • Michael Hanke
  • Felix Henninger
  • Christin Henzen
  • Christian Himpe
  • Julian Hniopek
  • Volker Hofmann
  • Timothy Holbrook
  • Dorothea Iglezakis
  • Holger Israel
  • Ariane Jeßulat
  • Angela Kailus
  • Naouel Karam
  • Ashish Karmacharya
  • Bhavin Katabathuni
  • Jürgen Kett
  • Wibke Kleina
  • Paul Klemm
  • Olaf Kletke
  • Oliver Koepler
  • Chantal Köppl
  • Anne Koziolek
  • Angela Kranz
  • Alessandra Kuntz
  • Herbert Lange
  • Elfrun Lehmann
  • Johannes Liermann
  • David Linke
  • Brigitte Mathiak
  • Katrin Moeller
  • Robert Nasarek
  • Steffen Neumann
  • Dennis Niewerth
  • Sven Ohmann
  • Judith Pfeiffer
  • Klaus Pietschmann
  • Renate Polak-Bennemann
  • Etienne Posthumus
  • Andreas Redelbach
  • Stephanie Rehwald
  • Lorenz Reimer
  • Thomas Richter
  • Raphael Ritz
  • Thomas Rose
  • Daniel Röwenstrunk
  • Harald Sack
  • Stefan Sandfeld
  • Kristin Sauerland
  • Björn Schembera
  • Hansjörg Scherberger
  • Gunther Schiefer
  • Sirko Schindler
  • Carsten Schmidt
  • Thomas Schörner
  • Torsten Schrade
  • Daniela Schulz
  • Renat Shigapov
  • Emanuel Söding
  • Xenia Specka
  • Arnost Stanzel
  • Regine Stein
  • Rainer Stotzka
  • Martin Stricker
  • Dieta Svoboda-Baas
  • Dzulia Terzijska
  • Victoria Tokareva
  • Thorsten Trippel
  • Björn Usadel
  • Axel Vitzthum
  • Frank Weber
  • Dirk Weisbrod
  • Jörg Wettlaufer
  • Heinrich Widmann
  • Rebecca Wilm
  • Dirk Wintergrün
  • Atinkut Alamirrew Zeleke