Hallo.
Gibt es Software oder Onlinedienste wo man dauerhaft Text in natürlicher Qualität (wie Elevenlabs) kostenlos lesen lassen kann?
Software für den PC wäre ideal.
Auf Webseiten zum Download der Datei, oder aber auch nur als Demo.
Eine Demo hat evtl. den Vorteil dass es keine Beschränkung der Nutzungsmenge gibt...
Es wird eh alles was heute noch als KI-Dienst online recht teuer (20, 30, 50... Euro/Dollar pro Monat ist für Privat... und dann auch noch mehrfach) angeboten wird, lokal auf dem Rechner möglich sein. Diverse gute KI gibt es lokal, aber ohne Installation und GUI...
Es müsste nur noch massenkompatibel mit .exe und Nutzeroberfläche veröffentlicht werden.
Gerade für Audio sollte die Rechenlast noch überschaubar sein.
"Stefan (Natural Voice)" von Microsoft klingt nach heutigen Maßstäben nicht mehr so natürlich, und hat heftige Sprachfehler.
Da muss irgendein Defekt vorliegen.
Interessant wäre eine Sprachsynthese in Videoschnittsoftware.
So dass man Voice-Over über Videos und Bilder einfach per Texteingabe erzeugen kann.
Ich erinnere mich dunkel an Dokus oder Reportagen etc., wo diese Möglichkeiten für die Zukunft gezeigt wurden.
Auch umgekehrt automatisch erkannter Text in Video, so dass man in der Schnitt-Software Stellen leicht finden und schneiden kann, indem man Text entfernt.
Das wäre evtl. noch eine eigene Frage.
P.S.:
Es gibt einige verbitterte Trolle, evtl. aus dem IT-Bereich (aber meist wohl nicht im KI-Bereich aktiv), oder aus Bereichen die durch KI ersetzt werden, die glauben sie wären moralisch im Recht auf solche Fragen pöbeln zu dürfen.
Der letzte Eintrag dieser Art zu einer ähnlichen Frage wurde ca. 1min nach Eintrag gelöscht und durch GuteFrage verwarnt...
Ich versuche es hier mal in "Bild-, Video- & Audiobearbeitung".
Bei der Frage zu Video-KI hatte ich nicht daran gedacht, und ich glaube Informatik gewählt.