Frage von Reca66, 28

Wo finde ich eine Software oder Lösung zum Vergleich von Textdateien mit Auflisten übereinstimmender Begriffe?

Hallo – Ich suche eine Software die es mir ermöglicht eine grössere Anzahl UNTERSCHIEDLICHER Text-Dokumente miteinander zu vergleichen, und übereinstimmende Wörter/Begriffe auflistet. Wichtig wäre es zudem eine Ausschlussliste erstellen zu können, mit der von der Suche auszuschließende Wörter bestimmt werden können (z.B. „und“ „an“ „im“ etc.) Zu vergleichende Dokumente könnten im Format Word oder eventuell PDF sein. Im Netz kann ich nichts finden was diese Funktion zu haben scheint. (Es geht NICHT um den Vergleich ähnlicher Dateien um Unterschiede/Dupletten zu finden). Wäre für einen guten Tip dankbar. Grüsse Reca66

Antwort
von wotan38, 12

Ich habe ein Programm, das zwei Textdateien vergleicht und in einer Auflistung die Unterschiede anzeigt.

Die Zeilenlänge bei den Textdateien kann maximal 256 Zeichen lang sein. Bei festgestellten Differenzen versucht das Programm eine neue Übereinstimmung bis zu einer Tiefe von 10000 Zeilen zu finden, um den Vergleich fortzusetzen.

Falls Dir das zusagt, schicke mir eine mail auf wotan38@gmx.org mit dem Betreff Programm compare.exe.

Ich schicke Dir das Programm dann, es ist Freeware und kostet nichts. Es beinhaltet keinerlei (unerwünschte) Zusatzfunktionen, geht auch nicht ins Internet. Es ist garantiert virenfrei, da ich es selbst erstellt habe.

Kommentar von Reca66 ,

Hallo Wotan38 - Danke für Deine Antwort. Leider scheint dies für mich nicht die Lösung zu sein. Ich suche wie gesagt eine Software oder ein System, das mir Übereinstimmungen (nicht Unterschiede) anzeigt. Und dies sollte idealerweise auch für mehrere grosse Dateien funktionieren. (z.B. 30 Dokument a 4.000 - 12.000 Wörtern, also vielleicht ca. 25.000-80.000 Zeichen?.) Hier sollte eine Suche dann übereinstimmende Begriffe identifizieren können. (Wie geschrieben macht das natürlich nur Sinn, wenn man zuvor eine Ausschlussliste erstellen kann (o.ä.), sodass Wörter wie "und" "Aber", "auf", "in", etc. nicht als Fund gewertet werden. Ob es sowas gibt ???

Grüsse Reca66

Kommentar von wotan38 ,

Ob es sowas gibt, weiß ich nicht. Grundsätzlich kann man aber sowas programmieren. Man müsste den Vergleich auf Schlagwörter reduzieren und nach Häufung der Übereinstimmungen suchen. Solche Aufgaben wie Daten aus verschiedenen Quellen zusammenzuführen habe ich schon öfter machen müssen. Das muss aber immer individuell programmiert werden und ist recht aufwändig.

Keine passende Antwort gefunden?

Fragen Sie die Community