Wie kann man Sonderbuchstaben (ü --> Ü) wieder in normale Buchstaben konvertieren?
Ich habe eine .txt Datei, wo mehrere Wörter zu finden sind. Aber wenn ich es mit with open(".txt","r") as f: öffne werden alle Sonderbuchstaben in kryptische Buchstaben umgewandelt ( Ü --> ü). Jetzt möchte ich die Buchstaben wieder in normale Buchstaben umwandeln (oder von Ü --> UE). Ich weiß auch, dass es in Pyhton .replace() gibt, aber ich weiß nicht wie ich es machen kann. Oder kann man vielleicht auch es direkt formatiert importieren?
Das Ergebnis basiert auf 2 Abstimmungen
Technische Fragen erfordern in der Regel eine technische Antwort und keinen multiple choice Fragebogen.🙄
Ich wollte nur kurz alle Möglichkeiten aufzählen, sodass man schnell antworten kann und nicht alles lesen/verstehen muss
2 Antworten
Du musst nur die richtige Kodierung angeben:
open(".txt","r", encoding='utf-8')
Siehe Doku.
öffne die zu lesende Textdatei einfach als UTF8 codiert.
import io
with io.open(filename,'r',encoding='utf8') as f:
text = f.read()
wenn du die Datei ohne Angabe zur Codierung öffnest, werden UTF8-Zeichen als zwei 8Bit ASCII Zeichen interpretiert 16Bit 'Ü' ergibt dann die beiden ASCII-Zeichen 'Ã' und '¼'.