11. März 2024
Allgemein

NVIDIA wird verklagt: Urheberrechtsverletzung wegen KI-Training

NVIDIA wird verklagt, aufgrund von Urheberrechtsverletzungen. Dies stellt das Unternehmen und sein LLM-Toolkit NeMo vor juristische Herausforderungen.

Die Tatsache, dass etwas im Internet verfügbar ist, bedeutet nicht, dass alles frei nutzbar ist.

Wer schon einmal ein Buch geschrieben und professionell veröffentlichen ließ, weiß, dass das eigene Werk durch Urheberrechtsgesetze geschützt ist. Es gibt zwar Ausnahmen und Einschränkungen, wie die Fair-Use-Regelung, aber die Gesetze sind sehr klar und strikt. Nun haben drei amerikanische Autoren Klage eingereicht. Sie behaupten, NVIDIA habe gegen diese Gesetze verstoßen, indem das Unternehmen ihre Werke ohne Erlaubnis nutzte, um sein LLM-Toolkit namens NeMo zu trainieren.

Urheberrechtsfragen in der KI-Entwicklung

Generative KI-Modelle, wie GPT-3, Llama und Dall-e, benötigen riesige Datenmengen für ihr Training, um in Werkzeugen wie ChatGPT und Copilot eingesetzt werden zu können. Bei NeMo handelt es sich technisch gesehen um ein Framework für KI-Entwickler, das es ihnen erleichtern soll, eigene Large Language Models (LLMs) zu erstellen, anzupassen und zu verteilen.

Trotzdem muss es für die KI-Ausbildung trainiert werden, und zusätzlich bietet NVIDIA eine Reihe vortrainierter Modelle in seinem Cloud-Service an. Der Bericht von Reuters über die Klage (über Seeking Alpha) ist in den Details noch etwas spärlich, aber der Fall ist noch sehr frisch, da er erst letzte Woche eingereicht wurde. Die drei Autoren (Brian Keene, Abdi Nazemian und Stewart O’Nan) behaupten, dass einer der sehr großen Datensätze, die NVIDIA für sein Training verwendet hat, Kopien ihrer veröffentlichten Werke enthält und die Nutzung ohne Erlaubnis erfolgte.

Normalerweise konzentriert sich die Verteidigung in solchen Rechtsfällen darauf, dass es sich um ein Beispiel für „Fair Use“ handelt, und Meta hat sogar behauptet, dass es im Grunde genommen nicht anders ist, als wie ein Kind lernt, indem es Sprache und Text in seiner Umgebung aufnimmt.

Andererseits haben diejenigen, die in der Vergangenheit Klagen eingereicht haben, wie die New York Times, gesagt, dass es einfach darum geht, dass die KI-Welt nicht bereit ist, die fälligen Gebühren für Werke zu zahlen, die nicht nur durch Urheberrechtsgesetze geschützt sind, sondern auch ordnungsgemäß bei den zuständigen Behörden registriert wurden.

Befürworter generativer KI sehen das jedoch anders: Wenn man eine Vielzahl von Büchern gelesen hat und dann einen eigenen Bestseller schreibt, verstößt man dann gegen das Urheberrecht? LLMs verwenden nicht automatisch exakte Kopien des Materials, das im Training verwendet wurde, und wer schon einmal etwas wie Stable Diffusion benutzt hat und es aufgefordert hat, ein berühmtes Gemälde zu zeichnen, bekommt eines, das dem Original ähnelt, aber keine direkte Kopie ist.

Fazit

Es handelt sich zweifellos um eine komplexe Situation, aber sollte dieser Sammelklagefall erfolgreich sein, wird er fast sicher von zahlreichen weiteren gefolgt, da der fragliche Datensatz nahezu 200.000 Romane, Kurzgeschichten, Lehrbücher usw. verwendet. All dieses Material ist urheberrechtlich geschützt, auch wenn nicht notwendigerweise alles davon registriert wurde.

Wie auch immer, der Zug der KI-Klagen zeigt keine Anzeichen einer Verlangsamung, und ich kann mir vorstellen, dass eine große Anzahl von Schriftstellern, Künstlern, Musikern und Designern den Ausgang dieses besonderen Falles genau beobachten werden.

In diesem Sinne,
herzlichst Ihr,

Mirza M. Oezoglu

Kategorien

Mirza M. Oezoglu

Gründer und Geschäftsführer

Hi, ich werde mich schnellstmöglich bei Ihnen melden!

Hinweis: Wir haben das Pflichtfeld gekennzeichnet. Alle anderen Felder sind freiwillige Angaben. Wir verwenden Ihre Daten nur streng zweckgebunden. Zum Beispiel zur Bearbeitung und Beantwortung Ihrer Anfrage. Diese Daten werden elektronisch erhoben und gespeichert. Informationen zu der Datenverarbeitung finden Sie hier: Datenschutz.

Fragen oder Anregungen? Ich helfe gerne weiter.