Frage von freifrauvomsee, 18

Wie funktioniert die Buchstabenvorhersage?

Ein wissenschaftlicher Artikel beschäftigt sich mit der Buchstabenvorhersage für Sprachausgabegeräten für Behinderte. Dabei geht es um Buchstabenvorhersage mit Huffman-Codes. Ein Test arbeitet mit unigram- (ein Buchstabe), das andere mit Achtgram-Vorhersage. Ich verstehe nicht, was das genau bedeutet: Auf was bezieht sich die unigram bzw. achtgram Voraussage? Die Statistik bezieht sich auf Texte aus der jeweiligen Sprache, nicht?

Hilfreichste Antwort - ausgezeichnet vom Fragesteller
von PeterKremsner, 9

Grundsätzlich ist es so, dass aus der Häufigkeit der Verwendeten Wörter ein Huffman-Code gebildet wird, der Verbessert die Entropie und erhöht somit den Informationsgehalt der Sprache bzw des "Alphabets".

Im wesentlichen ist es so, dass Wort bzw Buchstabenvorhersage darauf bereut dass nach einer Reihe von Wörtern beurteilt wird, welches das wahrscheinlich nächste Wort, oder der nächste Buchstabe sein wird.

Bei der Unigramvorhersage wird nur das Vorherige Wort bzw der vorherige Buchstabe in die Berechnung miteinbezogen.

Bei der Achtgramvorhersage werden die letzten acht Wörter bzw Buchstaben in die Berechnung miteinbezogen.

Grundsätzlich ist es ja so, dass die Berechnung immer genauer werden kann, je mehr Information man über die Sprache hat oder je mehr Wörter man nimmt, allerdings steigt dadurch auch der Rechenaufwand...

Antwort
von safur, 4

Ich kenne das eher von der Verschlüsselung. Wenn man schon mal die Sprache kennt, ist das super.

Dann geht man nach den N-Gramms. Je nach Sprache haben Wörter eine gehäufte Anzahl der Verwendung. Das ist nur eine Möglichkeit um einen verschlüsselten Text zu lösen.

In Englisch könnten das Wörter mit drei Buchstaben sein
and, why, the, she .. oder so ähnlich.

Nun versuchst du aufgrund der Häufigkeit Rückschlüsse auf das Wort zu schließen.

Sagen wir mal das Wort "und" im Deutschen.

Kommt nun in deinem Fließtext 20 x "und" vor, suchst du halt in der Statistik ein Wort was in der Sprache gehäuft vorkommt. Ich spreche hier immer noch von einem verschlüsselten Text.

Dann gibt es noch so Ketten. z. B. wenn ein "wie" steht kommt oft ein "geht" danach.

Dein Huffmann-Code ist auch hier erklärt. Man geht nach der Häufung der Buchstaben.

Wenn du jetzt noch die Wortketten hast, die ich oben erklärt habe, weißt du wie häufig ein Buchstabe auf einen anderen folgt.
z. B. "M" und dann ein "k" wird praktisch 0 sein.

http://www.ziegenbalg.ph-karlsruhe.de/materialien-homepage-jzbg/cc-interaktiv/hu...

Keine passende Antwort gefunden?

Fragen Sie die Community

Weitere Fragen mit Antworten