Python: Kreuzworträtsel Probleme mit Umlauten?

3 Antworten

Eigentlich müsste dies funktionieren ...

Für die deutschen Umlaute und ß gibt es (intern) verschiedene Codierungen. Z.B. latin-1 oder heute meist utf-8.

Dein Editor, mit dem du dieses Programm erstellt hast, hat vermutlich utf-8 verwendetet, da du sonst ein deutsches Spezialzeichen nicht ohne weiteres als String-Konstante eingeben kannst.

Die Frage ist nun, wie die deutschen Zeichen in der Wörterbuch-Datei codiert sind - oder wurden sie dort durch 2 Buchstaben, z.B. ae statt ä gespeichert. Schaue dir mal die Datei in einem Texteditor an.

Wie hast du die Datei eingelesen (siehe 'open' Funktion)

Du musst eventuell die Codierung angeben, z.B.

Eingabe= open('DATEINAME',mode='r',encoding='latin-1')

bzw.

Eingabe= open('DATEINAME',mode='r',encoding='utf-8')

Da man im Kreuzworträtsel eh Umlaute so wie "ae" statt "ä" schreibt und ein "ß" auch ein "ss" ist.. wieso machst du es dir nicht einfach und schreibst es so hin? Du kannst auf der Seite doch hinweisen, dass man die Umlaute und das scharfe s ausschreiben soll. Oder verstehe ich was falsch? ^^

Woher ich das weiß:Berufserfahrung – Fachinformatiker für Anwendungsentwicklung
JulianABC 
Fragesteller
 17.05.2017, 00:18

So könnte man es natürlich auch lösen, aber ich bin eigentlich auf der Suche nach einer eleganteren Methode.

0
kleinkirmit  17.05.2017, 00:23
@JulianABC

setze variable für die umlaute und definiere zb. Ä = AE

askii x = askii y, askii z etc.

0

welches fontset wird verwendet?

JulianABC 
Fragesteller
 17.05.2017, 00:03

utf-8

0
kleinkirmit  17.05.2017, 00:06
@JulianABC

das ist nicht das fontset! fontset kann zb arial / englisch sein ... dann gibt es keine umlaute im fontset das für die abfrage verwendet wird, sehr wohl aber auf deiner tastatur wenn du arial / german verwendest.

0
JulianABC 
Fragesteller
 17.05.2017, 00:11
@kleinkirmit

Schon wieder was gelernt.

Dann müsste es arial / german sein.

0
kleinkirmit  17.05.2017, 00:12
@JulianABC

zb . ... in der programmierplattform wirst du englische fontsets haben ;-)

da ist askii x dann ein anderes zeichen -> kein match!

0