Unterschied zwischen ISO 8859 und UTF-8-Format?
Hallo Leute,
Es geht um folgende Frage:
Die ersten 256 Zeichen des Unicodes sind identisch mit dem Zeichensatz Latin-1 der ISO 8859 (ISO 8859-1). Entspricht damit jeder ISO-8859-codierter Text automatisch auch dem UTF-8-Standard?
Ich glaube nicht, denn beispielsweise hat der oberste Bit eines Bytes im UTF-8-Code eine andere Bedeutung, bin mir aber nicht sicher.
2 Antworten
Nur die ASCII Zeichen sind gleich bei UTF8 und ISO 8859-1
D.h. die ersten 127 Zeichen!
Der UTF8 hat übrigens 1 bis 4 Bytes je zeichen
ISO 8859 hat mehrere Teile. Es gibt keinen Zeichensatz ISO 8859, sondern lediglich 8859-1 etc. Es kann demzufolge keinen ISO-8859-codierten Text geben.
Bei allen Teilen entsprechen die ersten 128 Zeichen dem ASCII-Zeichensatz (7 Bit). Die Unterschiede liegen also in der zweiten Hälfte des Zeichenumfangs.
Entspricht damit jeder ISO-8859-codierter Text automatisch auch dem UTF-8-Standard?
Diese Frage ist demzufolge umzuformulieren:
Entspricht damit jeder ISO-8859-1-codierter Text automatisch auch dem UTF-8-Standard?
Diese Frage kann man mit "ja" beantworten.