Ich suche eine gute Python-Spracherkennungsbibliothek?

1 Antwort

Bei GPT bist du schon bei der richtigen Firma, OpenAI. Mit Whisper kannst du in verschiedenen Sprachen spracherkennungen haben.

https://github.com/openai/whisper/

Da müsstest du halt nur noch gucken, dass du mit irgendeiner Lib deinen Mikrofoninput bekommst, sodass nach X zeit stille automatisch eine mp3 generiert wird welche dann durch Whisper in Text umgewandelt wird. Punkto dessen kann ich dir auf die schnelle außerhalb von speech_recognition keine Bibliothek nennen, jedoch müsstest du damit rein theoretisch auch die alleinige Audioaufnahme abseits der Erkennung kriegen.