Wie geht das, das sich Umlaute aus Buchstaben und Strichel zusammen setzen?

2 Antworten

Der Text enthält sehr wahrscheinlich Unicode-Zeichen, die aus mehreren Bytes bestehen können. Du musst jetzt erst mal ermitteln, mit welcher Codierung die Daten gespeichert wurden. Die häufigste Codierung ist UTF-8 und damit würde ich es erst mal versuchen.

Da ich nicht weiß, wie du die Dateien einliest und ich mich mit Access sowieso nicht auskenne, kann ich dir nicht konkret weiterhelfen. Aber sicherlich kann man beim Einlesen von Dateien die Kodierung mit angeben und/oder es gibt Stringfunktionen, die die Kodierung umwandeln. Damit kannst du dann bspw. UTF-8 in das Format deiner Datenbank konvertieren.

Woher ich das weiß:Berufserfahrung – Entwickle Anwendungen für iOS, iPadOS und macOS beruflich.

Ein Byte hat acht Bits, damit kann man 255 Zeichen darstellen. Mit US-amerikanischen Groß- und Kleinbuchstaben, Ziffern und Sonderzeichen ist das bald erschöpft. IBM ist ein US-amerikanisches Unternehmen, das viele Standards gesetzt hat.

Allein in Europa gibt es außer den lateinischen Buchstaben auch griechische und kyrillische. Von den asiatischen Schriftzeichen ganz zu schweigen.

Deshalb kann ein Zeichen zwei oder mehr Bytes belegen.

Manche Programme können das erkennen, bei anderen muss man beim Import von Daten die Codierung (z.B. UTF8) angeben.