ASCII Erweiterung?

2 Antworten

Vor UTF-8 hat jeder seinen eigenen Zeichensatz definiert (ANSI, Latin-1, ISO-8859-X, etc.), die ersten 128 Zeichen waren durch ASCII standardisiert, alles da drüber wurde vom jedem vergeben wie er gerade Lust hatte. Umlaute in Dateien, die man mit anderen Systemen austauschen wollte, waren daher eine schlechte Idee. In den Anfangstagen des Web musste man immer angeben, welcher Zeichensatz in einer Mail / Webseite verwendet wurde, damit es auch korrekt dargestellt wird. Schließlich reichen die restlichen 128 Zeichen im Zeichensatz nicht für die Umlaute aller Sprachen, kyrillische Zeichen, griechische Buchstaben, Sonderzeichen, etc gleichzeitig.

UTF-8 benutzt Zeichen, die aus mehr als einem Byte bestehen können. Das erste Byte sagt dem PC, das zu dem Zeichen noch X weitere Bytes gehören und alles zusammen bildet dann das eigentliche Zeichen. Damit lassen sich eben alle Zeichen darstellen, aber einfache (ASCII) Texte werden nicht länger und bleibt kompatibel zu ASCII, sofern keine der Sonderzeichen vorkommen.

B000T 
Fragesteller
 03.11.2022, 20:56

Danke für deine ausführliche Antwort

0

Der Zeichensatz von ASCII ist eben sehr begrenzt, darum hat man UTF-8 eingeführt.

Weil viele Terminals ASCII verwendet haben wurde UTF-8 abwärtskompatibel zu ASCII gemacht damit Dokumente usw welche mit ASCII Codierung geschrieben sind von UTF-8 Readern gelesen werden können.