KI zur Erstellung von Bildbeschreibungen nutzen
Inwieweit kann KI ein hilfreiches Tool zur Erstellung von Bildbeschreibungen für sehbehinderte und blinde Menschen sein?
Ich bin der Meinung, dass KI besser alle (relevanten) Details erfassen und wiedergeben kann, als ein Mensch das kann und daher genauer ist als die manuelle Beschreibung.
Wie sehr ihr das? Habt ihr KI dafür vielleicht schon genutzt und könnt aus Erfahrung berichten? Vielleicht sind ja hier auch Menschen, die auf Bildbeschreibungen angewiesen sind und dazu was beitragen können. Ich bin gespannt!
1 Antwort
dass KI besser alle (relevanten) Details erfassen und wiedergeben kann
Und ich bin der Meinung, dass der Himmel Rot-Gelb gestreift ist mit Hämmern und Sicheln
Das, was du beschreibst, gibt es schon auf so gut wie jeder Webseite, wenn man im HTML das "Alt" auch nutzt
Mal ganz davon abgesehen, dass es einfach Exponentiell mehr Rechenleistung verbraucht wenn jede Person per KI das Bild erstmal verarbeiten muss, als wenn die Webseiten einfach besser Reguliert werden und die wie schon genannten Features einfach nutzen und es selber beschreiben. Mal ganz davon abgesehen, dass sich dadurch einfach die Wahrscheinlichkeit erhöht, dass die KI einfach etwas falsches ausgibt (Was ja eig jedes mal passiert weil es ja bei jeder Person schon was anderes Ausgibt)
Ach, und besonders bei sowas wie Karikaturen wirds ganz lustig, da fangen die LLMs einfach mal an zu Interpretieren statt einfach zu beschreiben, wo wir wieder am Punkt ankommen, dass Willy Brandt dann entweder der große Führer Deutschlands war, der sich aber an die USA verkauft hat statt das Dritte Reich fortzuführen, oder Hitler 2.0 war, je nachdem ob die Person gerade Deepseek oder Grok nutzt.
Auf Instagram habe ich noch keine Funktion gefunden
Icvh bezweifle, dass du meinen Satz gelesen hast. Ich habe von HTML gesprochen. Und auch Webseiten und Apps, wie so alles im Fediverse haben das. Wenn sowas Instagram nicht hat, dann beschwer dich bei Meta oder bei deinen Lokalen EU Legislatoren
Dann kann die Person, die den Alt-Text irgendwo einsetzt
Whataboutism. Du hast in deiner Frage geschrieben, dass sowas Automatisch passiert. Sobald das aber wieder ein Mensch machen soll, sind wir wieder am Punkt angekommen, wo es einfach niemand macht weil es zu aufwendig ist
Dann muss man halt den Prompt entsprechend schreiben.
Und du widersprichst dich sogar in deiner eigenen Antwort. Zum einen soll ja die Person, die die KI nutzt um den Alt Text zu Generieren sowas einfach rausschneiden, zum anderen soll jetzt der Endnutzer einfach den Prompt umschreiben?
Mal ganz davon abgesehen, dass die Barrierefreiheit für die meisten KI Webseiten wie ChatGPT einfach nicht Existent ist, wer also wirklich nicht hinbekommen sollte zu sehen wird es auch nicht schaffen sich da Anzumelden um zu sehen was da geschrieben ist.
Icvh bezweifle, dass du meinen Satz gelesen hast.
Ich habe deinen Einwand schon gelesen – und stimme dir zu, dass HTML mit Alt-Tags ein zentraler Bestandteil barrierefreier Webgestaltung ist. Aber mein Punkt war: In vielen Apps und Plattformen – besonders außerhalb des Fediverse – ist das eben nicht oder nur unzureichend umgesetzt. Instagram ist da nur ein Beispiel. Dass wir uns grundsätzlich bessere Regulierung und verpflichtende Barrierefreiheitsstandards wünschen, darin sind wir uns vermutlich sogar einig.
Wenn sowas Instagram nicht hat, dann beschwer dich bei Meta oder bei deinen Lokalen EU Legislatoren
Klar kann ich das machen, ich bezweifle aber, dass das kurzfristig zu Verbesserungen führt. Genau deshalb habe ich diese Diskussion eröffnet: Um Ideen zu sammeln, wie man es sich heute schon einfacher machen kann.
Du hast in deiner Frage geschrieben, dass sowas Automatisch passiert.
Ich habe nie gesagt, dass niemand mehr mitwirken muss – sondern dass KI eine erste Grundlage liefern kann, die dann überprüft oder überarbeitet werden kann. Das ist ein Unterschied. Automatisierung und menschliche Kontrolle können sich ergänzen, vor allem dort, wo es bisher gar keine Beschreibung gibt.
Wenn ich überlege, wie viele Stunden ich schon mit dem Formulieren von Bildbeschreibungen verbracht habe, wäre es eine echte Hilfe, wenn KI zumindest einen Rohentwurf liefert. Das spart Zeit und senkt vielleicht die Hürde, überhaupt etwas zu schreiben.
zum anderen soll jetzt der Endnutzer einfach den Prompt umschreiben?
Ich meinte nicht, dass sehbehinderte & blinde Endnutzer selbst Prompts schreiben sollen, sondern dass Content-Ersteller*innen durch gezielte Prompts bessere Ergebnisse bekommen können – z. B. indem sie eine rein beschreibende statt interpretierende Ausgabe anfordern. Das ist ein Teil von „verantwortungsvollem KI-Einsatz“.
Barrierefreiheit für die meisten KI Webseiten wie ChatGPT einfach nicht Existent ist,
Ja, Barrierefreiheit bei KI-Anwendungen ist ein wichtiges Thema – da liegt vieles im Argen. Das zu kritisieren ist richtig. Aber gerade deshalb ist es doch wichtig, weiter an Lösungen zu arbeiten, statt die Technik als Ganzes abzulehnen. Denn wenn nur Tech-Affine Zugang haben, dann bleiben viele Menschen ausgeschlossen – genau das wollen wir doch vermeiden.
Und in Apps? Auf Instagram habe ich noch keine Funktion gefunden, die die Alt-Texte automatisch einsetzt. Das muss ich schon selber tun... Oder kannst du mir sagen, wo Instagram die Funktion versteckt hat, die Bildbeschreibung automatisch zu generieren?
Dann kann die Person, die den Alt-Text irgendwo einsetzt ja immer noch korrigieren. Aber so würde die Basis zumindest schonmal stehen.
Dann muss man halt den Prompt entsprechend schreiben.