AI darf Originalmaterial von anderen ausbeuten - wieso darf man den Quellcode von AI dann nicht auch einsehen und nutzen?
Oder darf man das?
4 Antworten
Also zum einen darf AI das meist auch nicht und zum anderen rechtfertigt das eine nicht das andere.
Darüberhinaus ist der Quellcode für einige AI Projekte öffentlich als OpenSource
das ist immerhin schon was - OpenSource wurde ja selbst von Seiten mancher AI-Betreiber als Grund angeführt warum sie Infos gezogen hatten, obwohl es nicht so deklariert war.
AI darf Originalmaterial von anderen ausbeuten
Nein, das darf sie nicht. Auch diese Plattformen und Techniken haben das Urheberrecht zu beachten. Entsprechend darf nur Material verwendet werden, für das kein Schutz mehr nach dem Urheberrecht besteht oder die Betreiber der AI/KI entsprechend Nutzungsgebühren an den Urheber entrichten.
Genau das "Ai darf das" ist strittig. Deshalb wird doch gerade so darum gefochten, dass die Quellen des Trainierens veröffentlicht werden müssen, lt. geplantem oder seit vorgestern sogar teils in Kraft getretenen EU-Recht. Hier geht es um Millionensummen im Zusammenhang mit Urheberrecht.
Allerdings ist der Quellcode genauso rechtlich Eigentum der Besitzer. Insofern ist das natürlich genauso nicht möglich.
Der "Quellcode" müßte ja im Model enthalten sein.
flux1-dev hat z. B. 23 GB, da ist nur die Frage, wie man die Datei einsehen kann und die hinterlegten Bilder einsehen kann.
https://huggingface.co/black-forest-labs/models
🤷♂️
Da in KI-Modellen keine Bilder oder Texte „hinterlegt“ sind, gar nicht.
Natürlich sind da Basis-Bilddateien enthalten. Woher wüßte denn Flux sonst, wie z. B. das Nike-Logo aussieht oder das Logo von Suzuki? Man kann die Modelle ja völlig offline verwenden. Wenn du dir die Ergebnisse ansiehst, die z. B. Flux liefert, wiederholen sich bestimmt Ergebnisse immer, z. B. bei Personen oder Kleidung. Um eine Lora zu trainieren braucht man ja auch Bilddateien.
Nein, da sind keine Bilddaten „enthalten“. 23 GB würden bei weitem nicht ausreichen, um die hunderten Millionen von Bildern, mit denen F.lux trainiert wurde, in der Modelldatei zu speichern.
Du musst dir ja auch keine 100.000 Bilder von Bananen visuell pixelgenau einprägen, um zu verstehen, wie eine Banane aussieht. Und das muss auch kein „KI-Modell“. In den Modelldateien (bzw. den „Gewichten“) landen nachher nur die mathematischen Gewichte, also die mathematischen Verbindungen zwischen den künstlichen „Neuronen“. Es ist somit nicht möglich, aus einem KI-Modell die Trainingsdaten wieder zu „extrahieren“. Völlig egal, ob es sich um ein LLM, ein Text-to-Image-Modell, oder ein anderes ML-Modell handelt.
So wie ich das sehe laufen viele Klagen, weil eben das Urheberrecht nicht beachtet wurde und auch von illegalen Seiten gescraped wurde.