Tonspur Sätze zerlegen und speichern Software?
Es gibt doch bestimmt eine Software, welche die Wörter von einer Tonspur von z.B einem Video erkennt und dann die Wörter einzelnd speichert und in einer alphabetisch geordneten Liste legt.
Bsp: Sprache im Video▶"Ich bin hier"(3sek) Liste: -▶"bin"(1sek) -▶"hier"(1sek) -▶"Ich"(1sek)
Bei aufwändigen Trump-comedy-videos oder Youtubekacke wird sowas bestimmt genutzt. Wo kann ich das finden? Ich kann es nicht selber programmieren.
4 Antworten

Nein, das wäre ja Spracherkennung, Audiobearbeitung und nochwas in einem. Nicht mal eine vernünftige Spracherkennung gibt es, schau dir z.B. die automatisch generierten Untertitel bei YouTube an, wenn nichtmal die es hinbekommen, wieso sollte es dann ein Programm dafür geben.

nein, diese Videos sind eifach sehr gut geschnitten. Ich selber produziere solche Videos. 2h Videos schauen und Notizen machen, 3h schneiden, 3h anpassen.

Wie schon geschrieben, kannst du das vergessen. Das ist noch wunderbare Handarbeit. Video schauen und die relevanten Teile rausschneiden. Größere Firmen haben dafür Leute, die den ganzen Tag nichts anderes machen und dann Datenbanken anlegen.
Für eine Softwarefirma ist das nicht interessant, weil viel zu komplex, also viel Produktionsaufwand und nur wenig potentielle Nutzer. Ist also wirtschaftlich nicht machbar... Höchsten als OpenSource-Spaßprojekt. Aber von irgendwas müssen die Programmierer ja leben.
Also Schnittsoftware nehmen und dann Video schauen und selbst schneiden.

Deine Einschätzung vom Zeitaufwand ist unterschätzt. Das liegt vielleicht daran, dass du dich damit nicht so gut auskennst. Die Kombination von Sprache und Bild ist schon etwas anderes. Man kann zwar die Sprache erkennen, aber daraus auch einen sauberen Schnitt in einer Mediendatei zu machen, dazu braucht es dann doch menschliche Augen, die den richtigen Schnittpunkt erkennen.
Es gibt teilweise Schnitthilfen, die Vorschläge machen können, aber frag dich mal selbst,warum es keine Software gibt, wenn es denn so einfach ist. Im realen Leben muss ein Programmierer auch Projekte machen, die einen Markt haben. Das Zerlegen von Reden für Comedy-Projekte ist einfach eine Sondersache, die nur selten gebraucht wird.

Ich denke, dass in diesen Comedy videos eher der Untertitel analysiert wird um Wortschnipsel zu finden.
Komplex? Einigermaßen gute Sprache-in-Text-Software gibt es schon lange. Dann einfach Schnitte zwischen den erkannten Wörtern setzen und speichern. Und dann mit einem Sortierangorithmus sortieren und in eine Liste packen. Mann muss einfach eine OpenSource-Spracherkennung nehmen. Listen und Sortieralgorithmen habe ich vor 2 Jahren beim Informatikunterricht gelernt. Dann eine Verbindung schaffen. Das könnte ich vielleicht mit viel Elan in 1Woche schaffen. Ich kenne mich damit nicht sehr gut aus, aber auf den ersten Blick sehe ich keine Schwierigkeiten