Die KI-Musikgeneratoren Suno und Udio stehen im Zentrum einer hitzigen Debatte um Urheberrechtsverletzungen. Anwälte der Plattenfirmen behaupten, es sei ihnen gelungen, durch geschicktes Prompting urheberrechtlich geschützte Songs oder Teile davon zu generieren. Der Vorwurf, dass die Modelle mit geschütztem Material trainiert wurden, steht im Raum. Ob und wie das Trainieren mit urheberrechtlich geschütztem Material verboten oder illegal ist, werden wir in den kommenden Wochen und Monaten in den amerikanischen Medien gespannt verfolgen können.
Die Anwälte haben dazu Listen angefertigt mit Verlinkungen zu den Plattformen und ihren Prompt-Outputs:
Hier Udio
Hier Suno
Wie können Künstlerinnen trotz der rechtlichen Unsicherheiten weiterhin mit KI-Musik arbeiten, bis eine klare Rechtsprechung oder Entscheidung getroffen wurde?
Eine mögliche Lösung sind Open-Source-Modelle, die ihren Trainingskatalog öffentlich einsehbar machen und somit nachweisen können, dass sie keine unerlaubten Kopien erstellen. Zudem gibt es AI-Modelle, die sich ethisch vertretbaren Trainingssets verpflichten und Künstlerinnen, die ihr Material freiwillig zur Verfügung stellen, entsprechend entlohnen.
Für weitere Informationen und Forschungsergebnisse zur KI in der Musikproduktion lohnt es sich, einen Blick auf die Webseite von JenMusic zu werfen. “Das Forschungsteam von Jen’s AI besteht aus führenden KI-PhDs und Wissenschaftlern, die gemeinsam über 30 veröffentlichte Forschungsarbeiten zur künstlichen Intelligenz in renommierten Fachzeitschriften wie T-PAMI, TKDE, TIP, SIGIR, AAAI, ICRA, NeurIPS, ICCV, CVPR und ACM MM vorweisen können.” schreiben sie selbst auf der Website unter Research wo ihr auch die Research-Paper finden könnt. Zusätzlich pflege ich auf meiner Website eine umfangreiche Linkliste mit nützlichen Ressourcen, die von Walter Werzowa im Rahmen seines Kurses „KI in der Musikproduktion“ an der GMPU zur Verfügung gestellt wurden. Diese Liste wird kontinuierlich mit neuen Erkenntnissen erweitert und aktualisiert.
Wie klingt JenMusic?
Hier findet ihr auch ein Hörbeispiel, das mit dem Prompt "Norse shamanic, tribal drums, rhythmic, war drums" generiert wurde. JenMusic bietet die Möglichkeit, WAV-Dateien zu erhalten und Tracks zu verlängern.
Interessant ist, dass das Modell von JenMusic ähnliche Frequenzartefakte ab 15 kHz aufweist wie Suno AI, die jedoch im Modell von Udio nicht vorkommen.
Referenzbilder:
- A: JenMusic AI Artefakte im Spektrogramm, sichtbar gemacht mit iZotope RX 10 Audio Editor
- B: Suno AI (Version 3.5, Version 3) Artefakte im Spektrogramm
- C: Udio AI Spektrogramm
- D: Synthetisch hergestellte Kickdrum im Spektrogramm
- E: Synthetisch hergestellte Kickdrum mit extremer Distortion, aber ohne Artefakte
Diese Frequenzlücken/Frequenzlöcher führen zu einem metallischen/blechernen Klang und können auf Dauer zu Hörermüdung führen. Diese Artefakte stammen höchstwahrscheinlich von komprimiertem Audiomaterial, das mit einem Codec verarbeitet wurde. Beim Vergleich verschiedener Spektrogramme liegt auch die Vermutung nahe, dass bestimmte Frequenzbereiche nicht generiert wurden. Dies könnte am Context-Window der generativen AI und der benötigten Rechenleistung für hohe Frequenzauflösungen liegen. Ich werde jedoch nach weiteren Evidenzen suchen.
Starting a-Deep-Dive Ende
Es bleibt abzuwarten, wie sich die rechtliche und ethische Diskussion weiterentwickeln wird, aber es gibt bereits Ansätze, die den kreativen Einsatz von KI in der Musikproduktion ermöglichen, ohne gegen Urheberrechte zu verstoßen.
Abschließend hoffe ich, dass ihr den Artikel spannend und informativ gefunden habt. Ich freue mich darauf, bald den nächsten Beitrag zu verfassen und euch weiterhin über die neuesten Entwicklungen im Bereich der KI-Musikproduktion auf dem Laufenden zu halten. Bleibt gespannt und bis zum nächsten Mal!