Wie kann ich sinnvoll eine Audio-Datei in einen Text umwandeln?

2 Antworten

Das korrigieren von Satzfehlern etc. ist bei schlechten bis mittelmäßigen Speech to Text Anwendungen beinahe mehr aufwand als das Transkribieren.

Ich hatte mal ein ähnliches Problem und hab es im Endeffekt händisch gemacht weil die automatische Transkription sowohl rechtschreibfehler und auch gramatikalische Fehler hatte und insgesamt an bestimmten Stellen gar nicht lesbar war und an anderen sogar Inhaltlich falsch war, weil bestimmte Fachwörter einfach durch andere ähnlich klingende Worte ersetzt waren.

Selbst in der heutigen Zeit mit angeblich viel künstlicher Intelligenz ist eine völlig freie Spracherkennung nahezu unmöglich. Bestehende Sprach-erkennungssysteme verstehen in den meisten Fällen nicht den kompletten Satzbau, sondern sind nur auf bestimmte Schlüsselwörter fixiert.

Sollte es so eine Software geben, gehe ich davon aus, dass nur Murks rauskommt. Um das Ergebnis zu korrigieren, musst Du Dir dann ständig den zeitlich passenden (!) Orginalton dazu anhören.

In dieser Zeit hast Du es dann auch manuell eingetippt ....