Guten Morgen aus Hamburg
Ich wollte wissen, wie KI folgenden einfachen Prompt interpretiert.
A serene autumn morning in Hamburg, Germany
Grok
Gemini
ChatGPT
Und würden eure Heimatorte aussehen?
Euch allen einen schönen Tag noch.
3 Antworten
Wieder ein interessanter Vergleich, wie die verschiedenenen KI´s auf eine Fragestellung reagieren.
Bei dem Bild von Grok hätte ich Hamburg nicht erkannt. Da ist nichts, was ich als typisch ansehen würde. Schönes idyllisches Bild.
Bei Gemini bin ich immer wieder bei deinen Vergleichen überrascht, dass die Bilder wie echte Fotos wirken.
ChatGPT scheint wohl als Merkmal immer übergenau sich auf kleinste Einzelheiten zu konzentrieren. Das wirkt dadurch nicht echt. Da sieht man gefühlt jedes Blättchen am Baum, doch dabei gibt es kein Vögelchen. Alles wirkt tot. Keine Zufälligkeiten, wie sie immer auf Fotos zu sehen wären. Kein Mensch oder Tier ist irgendwo zu entdecken. Kein Lüftchen bewegt etwas. Alles sieht aus wie ein sehr genauer Stahlstich oder ein Architekturgemälde.
„A serene autumn morning in Hamburg, Germany“ bedeutet für die KI:
- serene = ruhig, friedlich, klar
- autumn morning = herbstlicher Morgen, weiches Licht, gelbe/orange Blätter
- Hamburg = Stadtarchitektur, typische Gebäude, Elbe, Speicherstadt, Hafen, Brücken
- Germany = bestätigt kulturelle/visuelle Hinweise (z. B. typische deutsche Herbststimmung)
Die KI versucht also meist:
- warmes, weiches Licht (goldene Stunde)
- Nebel am Morgen
- herbstliche Blätter
- Hamburg-typische Orte (Speicherstadt, Elbphilharmonie, Hafen, alte Backsteingebäude)
- ruhige Atmosphäre, wenig Menschen
Gleichen Prompt für Midjourney bei TopMediai:
Sehr überzeugendes Bild von einer KI, von der ich noch nichts gelesen hatte.
Genau das fasziniert mich an KI-Tools: Selbst wenn man ihnen exakt dieselben Prompts gibt, kommen völlig unterschiedliche Ergebnisse heraus.
Jedes Bildmodell wurde mit anderen Datensätzen trainiert und hat seinen eigenen „Fokus“ – deshalb wirken die Resultate oft so verschieden. Und selbst dasselbe Modell liefert nie zu 100 % konsistente Bilder, weil die Generierung jedes Mal leicht variiert und das Modell ständig weiter optimiert werden muss, um bestimmte Stile zuverlässig zu treffen.
Ich merke das besonders, wenn ich mit Midjourney arbeite:
Ich bekomme immer gleich vier Bilder auf einmal – manchmal sehen ein oder zwei davon unglaublich realistisch aus, wie das Beispiel oben. Aber selbst beim gleichen Prompt unterscheiden sich die Bildkomposition, Details und sogar die Elemente im Bild oft komplett voneinander.
Grok finde ich sehr schön:)
Grok produziert einen regelrechten Feed von verschiedenen Bildern. Das hochgeladene ist eines von vielen. Die anderen Bilder haben eher an Husum oder Lübeck erinnert.