Wie schaffen es AI Bildgeneratoren solch realistische Fotos zu machen?

3 Antworten

Bild- und Videogenerierung mit KI funktioniert, indem ein neuronales Netzwerk (meist sogenannte Diffusionsmodelle) aus Millionen von Bildern, Grafiken und Videos lernt, wie typische Objekte, Stile und Zusammenhänge aussehen. Anhand eines Prompts wird dann aus einem anfänglichen Rauschen in mehreren Schritten ein neues Bild erzeugt, das zu den Vorgaben passt. Gibst du z.B. „Hund mit Partyhut“ ein, kennt das Modell solche Objekte aus seinen Trainingsdaten und kann sie kombinieren.

Noch spannender wird es, wenn man Diffusionsmodelle um sogenannte LoRAs (Low-Rank Adaptation) erweitert. Das sind Zusatzmodule, mit denen sich große KI-Modelle gezielt anpassen oder erweitern lassen – ohne das gesamte Modell neu trainieren zu müssen. Stattdessen werden zusätzliche Schichten eingefügt, die bestimmte Eigenschaften oder Stile lernen. So lassen sich etwa Porträts im eigenen Stil generieren oder Bilder von sich selbst auf Grundlage weniger Beispielbilder erstellen.

Woher ich das weiß:Berufserfahrung – Full-Stack Developer

Die KI sucht ähnliche Bilder, und setzt dann das Ergebnis Pixel für Pixel zusammen.

Je öfter die KI das macht, desto mehr lernt sie, und speichert ihre Erfahrung ab.


Ares71 
Beitragsersteller
 02.06.2025, 16:35

Danke, es ist wirklich erstaunlich.

Die KI wurde trainiert wie ein Gehirn. Und sie arbeitet auch wie ein Gehirn und "denkt" sich die Dinge dann aus. So wie es auch Menschen tun. Nur nicht ganz so komplex – bislang.


Babelfish  02.06.2025, 17:10

Das stimmt übrigens nicht. Generative KIs arbeiten gänzlich anders als ein Gehirn.

Ares71 
Beitragsersteller
 02.06.2025, 16:34

Danke für die schnelle Antwort. Ja ich merke es bei der imperfekten Darstellung von Händen oder Waffen, bei einigen Dingen gibt es Schwächen. Oder auch wenn Hände etwas halten sollen, wie zB. Schwerter.