AI darf Originalmaterial von anderen ausbeuten - wieso darf man den Quellcode von AI dann nicht auch einsehen und nutzen?

4 Antworten

Also zum einen darf AI das meist auch nicht und zum anderen rechtfertigt das eine nicht das andere.

Darüberhinaus ist der Quellcode für einige AI Projekte öffentlich als OpenSource

Woher ich das weiß:Berufserfahrung – Software Entwickler

EnzosRut 
Beitragsersteller
 03.08.2025, 11:09

das ist immerhin schon was - OpenSource wurde ja selbst von Seiten mancher AI-Betreiber als Grund angeführt warum sie Infos gezogen hatten, obwohl es nicht so deklariert war.

AI darf Originalmaterial von anderen ausbeuten

Nein, das darf sie nicht. Auch diese Plattformen und Techniken haben das Urheberrecht zu beachten. Entsprechend darf nur Material verwendet werden, für das kein Schutz mehr nach dem Urheberrecht besteht oder die Betreiber der AI/KI entsprechend Nutzungsgebühren an den Urheber entrichten.


EnzosRut 
Beitragsersteller
 03.08.2025, 11:07

So wie ich das sehe laufen viele Klagen, weil eben das Urheberrecht nicht beachtet wurde und auch von illegalen Seiten gescraped wurde.

Kelec  03.08.2025, 12:27
@EnzosRut
So wie ich das sehe laufen viele Klagen

Ja weil sie es eben nicht dürfen. Wenn es legal wäre würde es auch keine Klage geben.

Genau das "Ai darf das" ist strittig. Deshalb wird doch gerade so darum gefochten, dass die Quellen des Trainierens veröffentlicht werden müssen, lt. geplantem oder seit vorgestern sogar teils in Kraft getretenen EU-Recht. Hier geht es um Millionensummen im Zusammenhang mit Urheberrecht.

Allerdings ist der Quellcode genauso rechtlich Eigentum der Besitzer. Insofern ist das natürlich genauso nicht möglich.

Der "Quellcode" müßte ja im Model enthalten sein.

flux1-dev hat z. B. 23 GB, da ist nur die Frage, wie man die Datei einsehen kann und die hinterlegten Bilder einsehen kann.

https://huggingface.co/black-forest-labs/models

🤷‍♂️


Stoizismus  03.08.2025, 12:19

Da in KI-Modellen keine Bilder oder Texte „hinterlegt“ sind, gar nicht.

Jespa666  03.08.2025, 15:05
@Stoizismus

Natürlich sind da Basis-Bilddateien enthalten. Woher wüßte denn Flux sonst, wie z. B. das Nike-Logo aussieht oder das Logo von Suzuki? Man kann die Modelle ja völlig offline verwenden. Wenn du dir die Ergebnisse ansiehst, die z. B. Flux liefert, wiederholen sich bestimmt Ergebnisse immer, z. B. bei Personen oder Kleidung. Um eine Lora zu trainieren braucht man ja auch Bilddateien.

Stoizismus  03.08.2025, 21:57
@Jespa666

Nein, da sind keine Bilddaten „enthalten“. 23 GB würden bei weitem nicht ausreichen, um die hunderten Millionen von Bildern, mit denen F.lux trainiert wurde, in der Modelldatei zu speichern.

Du musst dir ja auch keine 100.000 Bilder von Bananen visuell pixelgenau einprägen, um zu verstehen, wie eine Banane aussieht. Und das muss auch kein „KI-Modell“. In den Modelldateien (bzw. den „Gewichten“) landen nachher nur die mathematischen Gewichte, also die mathematischen Verbindungen zwischen den künstlichen „Neuronen“. Es ist somit nicht möglich, aus einem KI-Modell die Trainingsdaten wieder zu „extrahieren“. Völlig egal, ob es sich um ein LLM, ein Text-to-Image-Modell, oder ein anderes ML-Modell handelt.