Ich suche eine gute Python-Spracherkennungsbibliothek?
Hallo, ich suche ein gutes Spracherkennungssystem für Python, am besten mit maschinellem Lernen, da "speech_recognition" für mein Projekt nicht optimal ist. Ich verwende ein etwas verrauschtes Mikrofon und möchte einen GPT-basierten Sprachassistenten mit einem Raspberry Pi erstellen. Es wäre ideal, wenn das Spracherkennungssystem lokal betriebsfähig wäre.
1 Antwort
Bei GPT bist du schon bei der richtigen Firma, OpenAI. Mit Whisper kannst du in verschiedenen Sprachen spracherkennungen haben.
https://github.com/openai/whisper/
Da müsstest du halt nur noch gucken, dass du mit irgendeiner Lib deinen Mikrofoninput bekommst, sodass nach X zeit stille automatisch eine mp3 generiert wird welche dann durch Whisper in Text umgewandelt wird. Punkto dessen kann ich dir auf die schnelle außerhalb von speech_recognition keine Bibliothek nennen, jedoch müsstest du damit rein theoretisch auch die alleinige Audioaufnahme abseits der Erkennung kriegen.