NA 105

DIN-Normenausschuss Terminologie (NAT)

2026-05-13

Entwurf DIN 19461 am 1. Mai 2026 erschienen

Humanoider Roboter liest ein Buch in einer Bibliothek.
© Midjourney / KI

Am 1. Mai 2026 ist mit Ausgabedatum Juni 2026 der Norm‑Entwurf DIN 19461 „Sprachressourcen und Sprachtechnologie – Abgeleitete Textformate (ATF)“ erschienen.

Was sind abgeleitete Textformate?

Abgeleitete Textformate (ATF) sind abstrahierte Darstellungen eines Originaltextes. Sie entfernen urheberrechtlich geschützte Inhalte, bewahren jedoch die für Analyse‑ und Forschungszwecke relevanten Informationen. Typische Beispiele sind Wortlisten, Frequenzlisten oder N‑Gramme.

Rechtssichere Nutzung für Analyse und Forschung

ATF ermöglichen damit eine rechtssichere Nutzung von Textsammlungen, insbesondere für Text‑ und Data‑Mining‑Verfahren (TDM). Sie schaffen Transparenz, erleichtern die Nachnutzbarkeit von Daten und unterstützen eine nachhaltige Zusammenarbeit zwischen Forschung, Entwicklung und Infrastrukturbetreibern.

Bedeutung für Large Language Models (LLMs)

Ein zentrales Anwendungsfeld abgeleiteter Textformate liegt in der Entwicklung und Verbesserung von Large Language Models (LLMs). Durch die Trennung von geschütztem Originalmaterial und analysierbaren Textrepräsentationen können moderne Analyse‑ und Trainingsverfahren eingesetzt werden, ohne urheberrechtliche Grenzen zu überschreiten.

Ziel und Inhalt der Norm DIN 19461

Der Norm‑Entwurf DIN 19461 formuliert allgemeine Grundsätze

  • für abgeleitete Textformate selbst,
  • für ihre Erstellung sowie
  • für ihre Bereitstellung und Nutzung.

Auf dieser Grundlage können Analyseverfahren gezielt an ATF angepasst werden. Gleichzeitig lassen sich die Grenzen und Möglichkeiten der Analyse, insbesondere bei geschützten Werken, klar benennen und dokumentieren. Ziel ist es, die Nutzung von Textsammlungen rechtlich sicherer zu gestalten, Vertrauen zu schaffen und neue Nutzungsperspektiven für moderne sprachtechnologische Methoden zu eröffnen.

Der Norm‑Entwurf wurde vom Arbeitsausschuss NA 105‑00‑06 AA „Sprachressourcen und Sprachtechnologie“ im DIN‑Normenausschuss Terminologie (NAT) erarbeitet.

Ihre Mitwirkungsmöglichkeiten

Der Norm‑Entwurf DIN 19461 kann noch bis zum 1. Juli 2026 über das DIN‑Norm‑Entwurfs‑Portal kommentiert werden. Fachliche Rückmeldungen aus Forschung, Entwicklung, Infrastruktur und Praxis sind ausdrücklich erwünscht.

Jetzt kommentieren und die Weiterentwicklung der Norm aktiv mitgestalten.

Ihr Kontakt

DIN e. V.
Annette Preissner

Am DIN-Platz
Burggrafenstraße 6
10787 Berlin

Zum Kontaktformular  

Verwandte Themen

Wählen Sie ein Schlagwort, um mehr zum Thema zu erfahren:

Weitere Informationen

  • Künstliche Intelligenz. Damit KI-Systeme in Zukunft sicher und verlässlich für uns arbeiten, braucht es Normen und Standards.