Verwandte Themen

Meinung des Tages: Wie ist Euer Umgang mit persönlichen (Bild-)Daten im Netz?

Liebe Community,

KI-Systeme wie Dall-e, mit denen Bilder generiert werden können, erfreuen sich seit längerer Zeit größter Beliebtheit. Natürlich benötigt die KI hierfür Trainingsdatensätze, die aus einer gigantischen Menge an realen Bildern & Texten bestehen. Laut neuester BR-Recherche sind diese allerdings aus datenschutzrechtlicher Hinsicht oftmals ein großes Problem.

Bildgeneratoren wie Stable Diffusion oder Dall-e funktionieren weitgehend identisch: Menschliche Nutzer beschreiben mit detaillierten Texteingaben (z.B. "Erstelle mir ein Bild von zwei männlichen Personen mittleren Alters, die gemeinsam am Strand sitzen und Wein trinken"), welches Motiv von der KI generiert werden soll. Und genau hierfür greift die KI auf Trainingsdatensätze zurück, anhand derer sie arbeitet und kontinuierlich weiter lernt. Diese Datensätze sammeln Links zu unzähligen Fotos im Netz.

Bei der genaueren Analyse des mitunter größten und öffentlich zugänglichen Trainingsdatensatzes (LAION5B) für KI-Bildgenerierung konnten BR-Datenjournalisten unter den geprüften Daten eine Vielzahl an personenbezogenen Daten herausfiltern: So beinhalteten diese Gesichter, Namen, Mail-Adressen und Geokoordinaten ließen demnach klare Rückschlüsse über die jeweiligen Personen zu.

Alleine im deutschsprachigen Teil des genannten Datensatzes ließen sich bei 20 Millionen Fotos Exif-Metadaten finden. Diese Zusatzinformationen werden vom Gerät (z.B. der Kamera) im Bild gespeichert und halten u.a. Infos zu Zeitpunkt und Ort der Aufnahme, dem Gerät oder dem genauen Standort des jeweiligen Fotos fest. Nach Meinung des Bundesamtes für Sicherheit und Informationstechnik sollten derartige "Restinformationen" vor der Datenweitergabe vernichtet werden.

Auf EU-politischer Ebene zumindest wünscht man sich wesentlich mehr Transparenz hinsichtlich KI-Trainingsdaten. Wie genau jedoch etwaige Regelungen in Bezug auf die Bereitstellung dieser Trainingsdaten aussehen könnten, ist derzeit unklar. Bis Ende 2023 sollen gemeinsame Regeln aufgestellt werden und in Kraft treten.

Unsere Frage an Euch: Wie ist Euer Umgang mit persönlichen Daten im Netz? Beschränkt Ihr den Zugang zu Fotos & Profil so gut es geht, z.B. durch private Profile bei Instagram oder Facebook oder achtet Ihr weniger darauf, wenn Ihr im Netz unterwegs seid? Welche gesetzlichen Maßnahmen wünscht Ihr Euch, damit sowohl KIs weiterentwickelt werden können, dabei aber auch der Schutz persönlicher Daten gewahrt bleibt?

Wir freuen uns auf Eure Antworten 💡

Viele Grüße

Euer gutefrage Team

Quelle: https://www.tagesschau.de/wissen/technologie/ki-trainingsdaten-privat-datenschutz-100.html

Ich achte auf Privatsphäre und bin weitgehend inkognito unterwegs 62%
Ich versuche einen gesunden Mittelweg zu finden... 28%
Ich mache mir keine Gedanken, wenn ich Fotos etc. im Netz poste 10%
Computer, Internet, Datenschutz, Zukunft, Technik, Sicherheit, Facebook, Politik, Recht, Privatsphäre, Datenschutzrecht, Wissenschaft, Social Media, Intelligenz, Europäische Union, EU-Recht, Gesetzgebung, Informationstechnik, künstliche Intelligenz, Gesetzgebungsverfahren, personenbezogene Daten, Politik und Recht, Instagram, TikTok, ChatGPT, Meinung des Tages

Meistgelesene Fragen zum Thema Personenbezogene Daten