Wie mache ich ein eigenes Text-To-Speech pack?
Moin servus,
ich bin zurzeit dabei einen eigenen Voice Assistant zu schreiben. Ich bin nun auf die Idee gekommen, eine eigene TTS Stimme einsprechen zu lassen. Ich habe definitiv nicht genug Geld um mir Monatlich speech.microsoft.com oder Descript oder so zu leisten.
Ich habe schon von Tacotron gehört, weiß aber nicht richtig, wie die Implementation davon funktioniert.
Hilfe und Tipps nehme ich gerne an, danke und LG
1 Antwort
Meine Idee wäre:
Zusammenhänge finden: Also ganzes Alphabet und Zahlen und dann aber nochmal AU, EU, LL usw. extra, da man die anders spricht. Dann Audio aufnehmen mit dem Laut-Sound und dann eine Audio Datei generieren, abspielen, löschen. Wäre so meine Idee dafür. Getestet habe ich es natürlich nicht. Hatte es aber selber mal vor zu probieren, reicht nur aktuell die Zeit nicht