Mit Abgeleiteten Textformaten (ATF) eröffnet Text+ eine Möglichkeit, Textdaten zu teilen und gleichzeitig das Urheberrecht zu beachten

Das Urheberrecht erlaubt zwar häufig die Analyse großer, zeitgenössischer Textsammlungen, verhindert jedoch viele Open‑Science‑Praktiken, die Transparenz, Reproduzierbarkeit und Wiederverwendbarkeit sicherstellen. Abgeleitete Textformate (ATF) lösen dieses Problem, da sie maschinell umgewandelte Versionen der Originaltexte darstellen, die keine urheberrechtlich geschützten Bestandteile mehr enthalten, während die für Disziplinen wie die Digital Humanities‑ (DH) und Natural Language Processing (NLP)-Forschung benötigten Informationen erhalten bleiben. Die so transformierten Texte können dann frei an andere Wissenschaftler:innen weitergegeben werden.

Wie ATF erstellt werden

Vier Grundoperationen werden verwendet und auf unterschiedlichen Granularitätebenen und Bezugsgrößen angewendet (z.B. Wort, Satz, Absatz, Werk, Korpus).

Operation	Was sie bewirkt	Beispiel
Löschen	Entfernt ausgewählte Textteile.	Alle Dialogzeilen aus einem Drama entfernen – der verbleibende Text ist nicht mehr urheberrechtlich geschützt, kann aber z. B. für Netzwerk‑Analysen oder Sprachmodellierung genutzt werden.
Ersetzen	Ersetzt ausgewählte Textteile durch einen Platzhalter oder andere Zeichen.	Jeden Eigennamen durch „NAME“ ersetzen, um einen Text zu anonymisieren.
Behalten	Bewahrt nur die gewünschten Teile und verwirft alles andere.	Nur die Häufigkeit jedes Tokens (Wort oder Satzzeichen) speichern – ergibt ein so genanntes „Bag‑of‑Words“, das z. B. für Autor*innen‑Attribution verwendet werden kann.
Vertauschen	Ändert die Reihenfolge größerer Einheiten, etwa Sätze.	Die Sätze eines großen Korpus zufällig neu anordnen; sofern der Korpus ausreichend umfangreich ist und die einzelnen Sätze nicht selbst geschützt sind, gilt das Ergebnis als urheberrechtsfrei.

Warum ATF wichtig sind

Durch strukturierte, rechtssichere Darstellungen von Texten ermöglichen ATF Forschenden aus Linguistik, Digital Humanities, Sprachtechnologie und anderen Disziplinen, die benötigten Daten zu nutzen, ohne das Urheberrecht zu verletzen. Kurz: ATF ermöglichen das Teilen und Wiederverwenden von textbasierten Forschungsdaten und wahren zugleich das Urheberrecht.

Mehr darüber:

https://text-plus.org/themen-dokumentation/atf/

Andere Beiträge

Beiträge

Bereitstellung von DMP Services für die Agrosystemforschung: DMP4NFDI in FAIRagro (Base4NFDI)

von Kall Kefle | Juli 24, 2026 | Basisdienst, Kollaboration, Kulturwandel, Success Story, Tools

FAIRagro-DMP-Service stärkt Forschungsdatenmanagement in der Agrosystemforschung
FAIRagro hat gemeinsam mit DMP4NFDI einen umfassenden Service für Datenmanagementpläne (DMPs) in der Agrosystemforschung entwickelt. Basierend auf dem Open-Source-Tool RDMO stellt der Dienst ein disziplinspezifisches DMP-Template mit Hilfetexten, Antwortvorschlägen und direkter Anbindung an den FAIRagro-Helpdesk bereit. Der Service unterstützt Forschende bei der Einhaltung von Fördervorgaben, fördert gute wissenschaftliche Praxis und verbessert die Auffindbarkeit, Zugänglichkeit und Wiederverwendbarkeit von Forschungsdaten gemäß den FAIR-Prinzipien. Das Angebot entstand im Rahmen mehrerer gemeinsamer Inkubatorprojekte mit DMP4NFDI und wird kontinuierlich weiterentwickelt, unter anderem durch die Integration kontrollierter Vokabulare in Zusammenarbeit mit TS4NFDI.

Wie eine Studie aus NFDI4Health den EHDS mitgestaltet

von Kall Kefle | Juli 6, 2026 | Infrastruktur, Kollaboration, Software, Success Story

NFDI4Health gestaltet den European Health Data Space
Mit wissenschaftlicher Evidenz unterstützt NFDI4Health die Entwicklung des European Health Data Space (EHDS) und trägt zu interoperablen Standards für Gesundheitsdaten sowie einer stärkeren Gesundheitsforschung in Europa bei.

Humanities@NFDI: Gemeinsam für nachhaltige Forschungsdaten

von Kall Kefle | Mai 29, 2026 | Geistes- und Sozialwissenschaften, Kollaboration, Kulturwandel, Success Story, Support

Fächerübergreifende Kooperation für den Erhalt des kulturellen Erbes
Die Humanities@NFDI-Initiative vereint vier NFDI-Konsortien, um Forschungsdaten aus den Geistes- und Kulturwissenschaften nachhaltig zugänglich und nachnutzbar zu machen. Durch gemeinsame Standards, Vokabulare und Community-Formate stärkt die Zusammenarbeit die Vernetzung und schafft die Grundlage für interdisziplinäre Forschung.

Mit Abgeleiteten Textformaten (ATF) eröffnet Text+ eine Möglichkeit, Textdaten zu teilen und gleichzeitig das Urheberrecht zu beachten

Andere Beiträge

Bereitstellung von DMP Services für die Agrosystemforschung: DMP4NFDI in FAIRagro (Base4NFDI)

Wie eine Studie aus NFDI4Health den EHDS mitgestaltet

Humanities@NFDI: Gemeinsam für nachhaltige Forschungsdaten

Search

Recent Posts

Recent Comments