Künstliche Intelligenz ist zunächst mal ein Marketingbegriff. Das hat mit Intelligenz erstmal überhaupt nichts zu tun.

Grundlage für diese ganze Geschichte sind neuronale Netze. Das wurde schon im letzten Jahrtausend entwickelt hat sich aber so richtig nicht durchgesetzt. Bei Wikipedia kannst du nachlesen wie neuronale Netze funktionieren und programmiert werden.

Ein sogenanntes large language Model LLM wie ein neuronales Netz auch genannt wird ist ein trainiertes neuronales Netz. Das heißt es stellt für bestimmte Eingabeparameter bestimmte Ausgaben zur Verfügung. Im Gegensatz zu herkömmlichen Computern ist die Ausgabe nicht deterministisch sondern hängt von der Eingabe und von dem Trainingszustand des Netzwerkes ab.

Um ein neuronales Netz zu trainieren muss es eine Menge von Informationen erhalten die bereits klassifiziert sind. Also wenn du ein LLM haben willst das erkennt ob auf einem Bild Personen zu sehen sind dann muss das LLM vorher mit tausenden oder Hunderttausenden Bildern trainiert werden. Auf den Bildern müssen von Hand die Personen markiert und dem LLM bekannt gemacht werden.

Erst dann kann das LLM mit unbekannten Bildern arbeiten und mit einer gewissen Wahrscheinlichkeit sagen ob auf einem ihm unbekannten Bild eine Person zu sehen ist oder nicht.