Fehler 'utf-8' codec can't decode byte 0xfc in position 54: invalid start byte in python?

2 Antworten

das finde ich sehr komisch, da in utf-8 ja aalle zeichen da sind, auch das ü(das Byte 0xfc ist das Byte 252 und dieses Byte ist ü)

UTF-8 ist eine Kodierung mit variabler Länge. Manche Codepoints werden als ein Byte, manche als mehrere (bis zu 4) Bytes kodiert. Somit hängt es vom Kontext (d.h. den Bytes davor) ab, ob das Byte 0xfc als "ü" dekodiert wird oder einfach an dieser Stelle falsch ist.

UTF-8 hat aber nicht nur 1 Byte , das hat immer mehrer Bytes und somit ist wohl das Startbyte falsch .

Theodor951Ernst 
Fragesteller
 25.07.2021, 16:42

Was ist ein Startbyte?

0
TechPech1984  25.07.2021, 16:48
@Theodor951Ernst

btw , es gibt UTF-8 with BOM , glaub ich ist windows und UTF-8 ohne BOM ist eben nicht windows . kanna uch sein das du ASCII zeichen dazwischen hast die ungültig sind . ÜÄÖ sind halt anders in der Latin definiert .

1