US-Plattenfirmen verklagen die KI-Musikgeneratoren Suno und Udio wegen Urheberrechtsverletzung

Die KI-Musikgeneratoren Suno und Udio stehen im Zentrum einer hitzigen Debatte um Urheberrechtsverletzungen. Anwälte der Plattenfirmen behaupten, es sei ihnen gelungen, durch geschicktes Prompting urheberrechtlich geschützte Songs oder Teile davon zu generieren. Der Vorwurf, dass die Modelle mit geschütztem Material trainiert wurden, steht im Raum. Ob und wie das Trainieren mit urheberrechtlich geschütztem Material verboten oder illegal ist, werden wir in den kommenden Wochen und Monaten in den amerikanischen Medien gespannt verfolgen können.

Die Anwälte haben dazu Listen angefertigt mit Verlinkungen zu den Plattformen und ihren Prompt-Outputs:

Hier Udio

https://s3.documentcloud.org/documents/24776029/1-2.pdf

Hier Suno

https://s3.documentcloud.org/documents/24776032/1-3.pdf

Wie können Künstlerinnen trotz der rechtlichen Unsicherheiten weiterhin mit KI-Musik arbeiten, bis eine klare Rechtsprechung oder Entscheidung getroffen wurde?

Eine mögliche Lösung sind Open-Source-Modelle, die ihren Trainingskatalog öffentlich einsehbar machen und somit nachweisen können, dass sie keine unerlaubten Kopien erstellen. Zudem gibt es AI-Modelle, die sich ethisch vertretbaren Trainingssets verpflichten und Künstlerinnen, die ihr Material freiwillig zur Verfügung stellen, entsprechend entlohnen.

Für weitere Informationen und Forschungsergebnisse zur KI in der Musikproduktion lohnt es sich, einen Blick auf die Webseite von JenMusic zu werfen. “Das Forschungsteam von Jen’s AI besteht aus führenden KI-PhDs und Wissenschaftlern, die gemeinsam über 30 veröffentlichte Forschungsarbeiten zur künstlichen Intelligenz in renommierten Fachzeitschriften wie T-PAMI, TKDE, TIP, SIGIR, AAAI, ICRA, NeurIPS, ICCV, CVPR und ACM MM vorweisen können.” schreiben sie selbst auf der Website unter Research wo ihr auch die Research-Paper finden könnt.

Zusätzlich pflege ich auf meiner Website eine umfangreiche Linkliste mit nützlichen Ressourcen, die von Walter Werzowa im Rahmen seines Kurses „KI in der Musikproduktion“ an der GMPU zur Verfügung gestellt wurden. Diese Liste wird kontinuierlich mit neuen Erkenntnissen erweitert und aktualisiert.

Wie klingt JenMusic?

Hier findet ihr auch ein Hörbeispiel, das mit dem Prompt „Norse shamanic, tribal drums, rhythmic, war drums“ generiert wurde. JenMusic bietet die Möglichkeit, WAV-Dateien zu erhalten und Tracks zu verlängern.

Norse schamanic, tribal drums, rhythmic,war drums, war cry.wav

Interessant ist, dass das Modell von JenMusic ähnliche Frequenzartefakte ab 15 kHz aufweist wie Suno AI, die jedoch im Modell von Udio nicht vorkommen.

Referenzbilder:

  • A: JenMusic AI Artefakte im Spektrogramm, sichtbar gemacht mit iZotope RX 10 Audio Editor JenMusic (Version Alpha) JenMusic (Version Alpha)
  • B: Suno AI (Version 3.5, Version 3) Artefakte im Spektrogramm Suno Version 3.5, deutlich weniger Artefakte wie in Version 3 Suno Version 3.5, deutlich weniger Artefakte wie in Version 3 Suno Version 3 Suno Version 3
  • C: Udio AI Spektrogramm Udio (Version Beta) Udio (Version Beta)
  • D: Synthetisch hergestellte Kickdrum im Spektrogramm Mit Operator in Ableton hergestellter Kick, Frequenzlöcher und Artefakte fehlen, klar keine Kompression, kein Codec. Mit Operator in Ableton hergestellter Kick, Frequenzlöcher und Artefakte fehlen, klar keine Kompression, kein Codec.
  • E: Synthetisch hergestellte Kickdrum mit extremer Distortion, aber ohne Artefakte Hoher Verzerrung mit Roar von Ableton Hoher Verzerrung mit Roar von Ableton Maximaler Verzerrung mit Roar, aber auch keine Frequenzlöcher oder metallischer Klang. Maximaler Verzerrung mit Roar, aber auch keine Frequenzlöcher oder metallischer Klang.

Diese Frequenzlücken/Frequenzlöcher führen zu einem metallischen/blechernen Klang und können auf Dauer zu Hörermüdung führen. Diese Artefakte stammen höchstwahrscheinlich von komprimiertem Audiomaterial, das mit einem Codec verarbeitet wurde. Beim Vergleich verschiedener Spektrogramme liegt auch die Vermutung nahe, dass bestimmte Frequenzbereiche nicht generiert wurden. Dies könnte am Context-Window der generativen AI und der benötigten Rechenleistung für hohe Frequenzauflösungen liegen. Ich werde jedoch nach weiteren Evidenzen suchen.

Starting a-Deep-Dive Ende


Es bleibt abzuwarten, wie sich die rechtliche und ethische Diskussion weiterentwickeln wird, aber es gibt bereits Ansätze, die den kreativen Einsatz von KI in der Musikproduktion ermöglichen, ohne gegen Urheberrechte zu verstoßen.

Abschließend hoffe ich, dass ihr den Artikel spannend und informativ gefunden habt. Ich freue mich darauf, bald den nächsten Beitrag zu verfassen und euch weiterhin über die neuesten Entwicklungen im Bereich der KI-Musikproduktion auf dem Laufenden zu halten. Bleibt gespannt und bis zum nächsten Mal!