Ob und unter welchen Bedingungen Künstliche Intelligenz (KI) mit urheberrechtlich geschützten Inhalten trainiert werden darf, ist eine der wichtigsten und zugleich umstrittensten Rechtsfragen im Jahr 2025 – und für Rechteinhaber wie Entwickler gleichermaßen relevant.
KI-Training: Wann liegt eine Urheberrechtsverletzung vor?
Das Training von KI-Systemen läuft technisch meist so ab: Daten (z.B. Texte, Bilder, Musik) werden gesammelt (Crawling/Scraping), gespeichert und analysiert.
Urheberrechtlich ist bereits das Speichern von Werken als Vervielfältigung relevant. Grundsätzlich gilt: Ohne Lizenz oder gesetzliche Ausnahme stellt das KI-Training mit urheberrechtlich geschützten Inhalten eine Rechtsverletzung dar.
Erlaubnis oder Nutzungsschranke?
Nicht nur für wissenschaftliche Zwecke gibt es mit der sog. DSM-Richtlinie europaweit allerdings Ausnahmeregelungen. In Deutschland wurden diese mit § 44b UrhG bzw. § 60d UrhG in nationales Recht umgesetzt.
Die allgemeine Text- und Data-Mining-Schranke des § 44b UrhG erlaubt die Speicherung (Vervielfältigung) rechtmäßig zugänglicher Werke, sofern kein expliziter maschinenlesbarer Nutzungsvorbehalt (sog. Opt-Out) des Rechteinhabers vorliegt. Für Institutionen oder Personen im wissenschaftlichen Kontext gilt darüber hinaus § 60d UrhG mit weitergehenden Privilegierungen, insbesondere ohne Opt-Out-Möglichkeit.
Kommerzielle Nutzungen benötigen grundsätzlich eine Lizenz, außer es greift die Schranke des § 44b UrhG.
Die Schranke verpflichtet zudem: Kopien der Werke müssen nach der Analyse umgehend gelöscht werden. Das dauerhafte Vorhalten im Datenset, z.B. für spätere Re-Trainings, ist nicht erlaubt.
LG Hamburg: Das erste Grundsatzurteil
Das Landgericht Hamburg (Urteil vom 27.09.2024, 310 O 227/23) hat erstmals entschieden, dass das Vervielfältigen von urheberrechtlich geschützten Werken im Wege des KI-Training unter das Text- und Data-Mining fallen und durch die Schranke des § 44b Abs. 2 UrhG gedeckt sein kann – aber ein wirksamer maschinenlesbarer Nutzungsvorbehalt reicht, um eine Nutzung zu untersagen.
Das Gericht ließ dabei offen, ob für den maschinenlesbarer Nutzungsvorbehalt ein Hinweis „in natürlicher Sprache“ genügt oder der Hinweis z.B. in einer robots.txt-Datei geschehen muss.
Zwar spreche einiges dafür, auch einen Hinweis „in natürlicher Sprache“ ausreichen zu lassen. Im konkreten Fall konnte das Gericht diese Frage jedoch offenlassen, da es eine wissenschaftliche Betätigung im Sinne des § 60d UrhG annahm, welche eine Opt-Out-Möglichkeit für den Rechteinhaber nicht vorsieht.
Müssen Urheber dulden, dass KI mit ihren Werken trainiert wird?
Für kommerzielle Nutzungen gilt: Solange kein ausdrücklicher Nutzungsvorbehalt (Opt-Out) in maschinenlesbarer Form erklärt wurde, ist das Training als Text- und Data-Mining nach § 44b UrhG zulässig.
Wer verhindern möchte, dass die eigenen Werke zu Trainingszwecken verwendet werden, sollte dies nach derzeit wohl überwiegender Meinung am besten in der robots.txt-Datei kennzeichnen.
Allerdings ist dieses Vorgehen mit einem erheblichen technischen Aufwand verbunden: Die robots.txt-Datei muss gezielt bekannte KI-Crawler ansprechen und aktuell gehalten werden, da ständig neue Crawler hinzukommen.
Ein Hinweis bspw. im Impressum könnte ausreichen, dies ist jedoch rechtlich noch nicht abschließend geklärt – insbesondere, wie eine KI menschliche Sprache „lesen“ soll und ob dies als maschinenlesbar gilt.
Erfolgt das Training für Zwecke der wissenschaftlichen Forschung im Sinne des § 60d UrhG ist es jedoch auch bei wirksam erklärtem Nutzungsvorbehalt zulässig.
Gegen eine solche Nutzung dürfte nur schützen, die Inhalte mit einem technischem Kopierschutz zu versehen. Denn auch das wissenschaftliche Text- und Data-Mining gilt nur für rechtmäßig zugängliche Werke. Dies wäre nicht der Fall, wenn der Nutzer sich den Zugang durch Umgehung eines Kopierschutzes verschafft.
Neue Pflichten durch den EU AI-Act (KI-VO) und Code of Practice
Mit Inkrafttreten der europäischen KI-Verordnung am 2. August 2025 gelten zudem zusätzliche Transparenzpflichten: KI-Anbieter müssen offenlegen, welche (auch urheberrechtlich geschützten) Inhalte zum Training genutzt wurden, und den Einsatz rechtswidriger Quellen vermeiden. Webseiten mit offensichtlich rechtswidrigem Geschäftsmodell dürfen zudem grundsätzlich nicht zum KI-Training verwendet werden; die Erklärung eines Opt-Outs ist Rechteinhabern dort naturgemäß nicht möglich.
So bestimmt bspw. Artikel 53 Abs. 1 lit. c) und d) der KI-VO, dass Anbieter von KI-Modellen (mit allgemeinem Verwendungszweck) eine Zusammenfassung der beim Training verwendeten Inhalte erstellen und veröffentlichen müssen. Außerdem müssen sie eine Strategie zur Einhaltung des Urheberrechts aufstellen und sicherstellen, dass keine Inhalte genutzt werden, bei denen Rechteinhaber einen Nutzungsvorbehalt (Opt-out) erklärt haben.
Zudem folgt aus dem General-Purpose AI Code of Practice, dass Webseiten mit offensichtlich rechtswidrigem Geschäftsmodell grundsätzlich nicht zum KI-Training verwendet werden dürfen, vgl. Measure 1.2 des Kapitels Urheberrecht.
Bei diesem Kodex, den u.a. Amazon, Anthropic, Google, Microsoft und OpenAI unterzeichnet haben, handelt es sich um ein freiwilliges Instrument, das Unternehmen helfen soll, die Anforderungen der KI-Verordnung praktisch und nachweisbar zu erfüllen. Er umfasst drei zentrale Kapitel Transparenz, Urheberrecht und Sicherheit.
Eine weitere Quelle für die oben beschriebenen Transparenzpflichten stellt der Erwägungsgrund 107 der KI VO dar.
Ausblick
Die finale Rechtsentwicklung bleibt abzuwarten, da viele Fragen derzeit noch offen sind und höchstrichterliche Entscheidungen sowie weitergehende gesetzliche Konkretisierungen noch ausstehen.
Sie möchten Inhalte zum KI-Training verwenden und fragen sich, ob dies urheberrechtlich zulässig ist? Oder Sie nutzen KI-generierten Content und fragen sich, ob und wie Sie diesen kennzeichnen sollten?
Nehmen Sie jetzt Kontakt auf. Als erfahrener Anwalt im Urheberrecht unterstütze ich Sie bei der rechtssicheren Nutzung von kreativen Leistungen und setze Ihre Rechte durch, wenn Ihre Werke ohne Erlaubnis verwendet werden.
