Audio – die neusten Beiträge

Sehr gute Sprachsynthese (außer Elevenlabs)? Als PC-Software? In einer Videoschnittsoftware (wäre sehr praktisch)?

Hallo.

Gibt es Software oder Onlinedienste wo man dauerhaft Text in natürlicher Qualität (wie Elevenlabs) kostenlos lesen lassen kann?
Software für den PC wäre ideal.
Auf Webseiten zum Download der Datei, oder aber auch nur als Demo.
Eine Demo hat evtl. den Vorteil dass es keine Beschränkung der Nutzungsmenge gibt...

Es wird eh alles was heute noch als KI-Dienst online recht teuer (20, 30, 50... Euro/Dollar pro Monat ist für Privat... und dann auch noch mehrfach) angeboten wird, lokal auf dem Rechner möglich sein. Diverse gute KI gibt es lokal, aber ohne Installation und GUI...
Es müsste nur noch massenkompatibel mit .exe und Nutzeroberfläche veröffentlicht werden.
Gerade für Audio sollte die Rechenlast noch überschaubar sein.
"Stefan (Natural Voice)" von Microsoft klingt nach heutigen Maßstäben nicht mehr so natürlich, und hat heftige Sprachfehler.
Da muss irgendein Defekt vorliegen.

Interessant wäre eine Sprachsynthese in Videoschnittsoftware.
So dass man Voice-Over über Videos und Bilder einfach per Texteingabe erzeugen kann.
Ich erinnere mich dunkel an Dokus oder Reportagen etc., wo diese Möglichkeiten für die Zukunft gezeigt wurden.
Auch umgekehrt automatisch erkannter Text in Video, so dass man in der Schnitt-Software Stellen leicht finden und schneiden kann, indem man Text entfernt.
Das wäre evtl. noch eine eigene Frage.

P.S.:
Es gibt einige verbitterte Trolle, evtl. aus dem IT-Bereich (aber meist wohl nicht im KI-Bereich aktiv), oder aus Bereichen die durch KI ersetzt werden, die glauben sie wären moralisch im Recht auf solche Fragen pöbeln zu dürfen.
Der letzte Eintrag dieser Art zu einer ähnlichen Frage wurde ca. 1min nach Eintrag gelöscht und durch GuteFrage verwarnt...
Ich versuche es hier mal in "Bild-, Video- & Audiobearbeitung".
Bei der Frage zu Video-KI hatte ich nicht daran gedacht, und ich glaube Informatik gewählt.

Audio, künstliche Intelligenz, Sprachausgabe

Audioprobleme mit verschiedenen Geräten?

Hallo zusammen,

ich habe ein Problem, zwar betreue ich den Podcast unserer Firma und stoße immer wieder auf ein Problem, dazu erst mein Workflow :

1.) Videoaufnahme: Ich nehme das Video auf mit 2 Kameras, ich habe dazu 2 Shure MV7 Podcast Mikrofone über USB-C am Macbook vom Chef eingesteckt, über dieses AUDIO MIDI Control App habe ich ein neues Gerät erstellt, das beide Mikrofone aktiviert sobald ich das Gerät auswähle, wir starten die Tonaufnahme über die Sprachnotizen App und die Aufnahme der Kameras

2.) Ich synchronisiere die Audio der Kameras mit dem Video in Premiere Pro danach öffne ich die Audio in Audition, konvertiere es in Stero, normalisiere auf 0,1dB packe den 20 Bänder EQ - Kräftig und Klar drauf und den parametrischen EQ mit Stimmoptimierung, danach regle ich über die Audioverstärkung immer um die +8dB ein, ich schneide dann mit der Multicamansicht und mache alles weitere fertig, animationen einblendungen etc. und am Ende exportiere ich das Video mit der Audio und ein weiteres mal nur die Audio ohne Video.

3.) Ich öffne Audition und lege eine neue Multitrack Session an, packe das Intro rein, dann auf einer anderen Spur den Podcast, regle diesen auch um die +8dB und setzte dann meistens einen hard limiter drauf, weil es manchmal clippt ich setze das Outro auf eine andere Spur, exportiere und lade es mit Captivate hoch.

Jetzt das Problem, an meinem Headset Jabra Evolve2 65 hört es sich gut an, an den Lautsprechern vom Mac Mini M2 eben so, auch am Handy ist es okay... aber sobald der Podcast im Auto abgespielt wird, sagen einige Leute, dass Sie den zweiten Sprecher nicht hören können, den ersten dafür umso mehr... habt ihr ideen woran es liegt, oder Optimierungsvorschläge?

Video, Audio, Adobe, Videobearbeitung, Aufnahme, Mikrofon, Videoschnitt, audition, Podcast, Premiere Pro, Sound, Tontechnik, Schnittprogramm

Meistgelesene Beiträge zum Thema Audio