Herold am 06.12.2008 um 11:50 Uhr
Also, mit anderen Worten: Mir liegen im PC abgescannte alte Zeitungsseiten vor, die in der typischen altdeutschen Schrift geschrieben worden. Ich möchte dort drin nach bestimmten Worten suchen.
Das geht natürlich nur, wenn über die gesamte(n) Seite(n) ein Texterkennungsprogramm "gestülpt" wurde.
Welches Programm eignet sich dazu?
Wichtig: Es sollte absolut nichts verunstaltet werden, also es sollten alle Worte genau an der selben Stelle stehenbleiben, Bilder und Rahmenlinen sollten ebenfalls alle erhalten bleiben usw.
Wer kann ein wirklich sehr gutes Programm empfehlen und hat selbst schon die von mir beabsichtigten Versuche gemacht?
Freue mich auf gute Antworten!
Weitere Fragen zu verwandten Themen finden Sie hier:

Kannst Du vor dem Suchen die Schriftart festlegen? Vielleicht funktioniert es so.
du brauchst ein lernendes OCR Programm. Hier musst du jeden Buchstaben einzeln einlernen, was fast alle guten Programme können. Nachdem alle Buchstaben eingelernt sind, läuft das reibungslos.

Eine interessante Frage.
Die OCR-Software ( Texterkennung oder auch Optische Zeichenerkennung )müsste Fraktur-Schriften erkennen. Auf diesem Spezialgebiet gibt es nicht sehr viel.
ABBYY FineReader XIX for Fraktur
für vielleicht annähernd brauchbare Ergebnisse.
Zum Spaß mal die Preisliste mit seltsamen Lizenzen von 340,- bis 1700,- EUR .
zzzap am 7. Dezember 2008 09:45 > Tesseract ist ein freies Texterkennungsprogramm welches bei der Google- Buchsuche verwendet wird.
http://de.wikipedia.org/wiki/Tesseract
Angeblich ist eine teilweise Erkennung von Fraktur-Texten möglich.
Tesseract hat keine grafische Benutzeroberfläche !
Die zukünftige Entwicklung des Programms wäre zu verfolgen.
> FreeOCR
beinhaltet Tesseract und hat eine Benutzeroberfläche für Windows.
http://softi.co.uk/freeocr.htm
http://www.heise.de/software/download/freeocr/49486
Weitere freie OCR-Programme für Windows :
zzzap am 7. Dezember 2008 09:53 ( Vielleicht ist das manuelle Abtippen der Texte zu Zeit noch schnellsten.? )
Herold am 7. Dezember 2008 11:04 Hallo, ich grüße Dich und danke für Deine viele Mühe! Ich schaue mir alles nochmal in Ruhe an, aber ich sehe schon dass mein Vorhaben kaum umzusetzen sein wird.
Es ist natürlich schäbig, dass die Firmen, die die Möglichkeit dazu hätten, solche horrende Preise verlangen und dann sogar noch die Seitenzahl begrenzen! Die blanke Habgier!!

Ohne manuelle Nacharbeit wird das wohl kein OCR-Programm leisten. Es gibt immer mal wieder Sonderzeichen, Rahmen werden verschoben etc.
Auch Omnipage wird da leider nicht so ganz ohne "Verunstaltung" funktionieren.
Aber nur um bestimmte Wörter zu suchen, dürfte es wohl funktionieren. Du behältst ja sicher das Original und experimentierst mit einer Kopie.
Herold am 6. Dezember 2008 15:35 Danke für Deine Hinweise! Ich war zwischenzeitlich erstmal einkaufen.
Ja, im Moment bezieht sich meine Absicht auf das Durchsuchen abgescannter uralter Zeitungen, die ich im Internet fand. Das Original bleibt da immer erhalten. Ich dachte mir das so, dass ich immer je ein ganzes Zeitungsblatt "durch das Programm jage" und an anderer Stelle diese ganze Seite in ordentlich lesbarer Schrift (und möglichst ohne große "Verstümperung") wiederfinde.
Kleine Dinge kann man natürlich selber ausbessern. Hauptsache, die altdeutsche Schrift wird sicher erkannt und ordentlich umgewandelt!

FineReader kann das generell...wobei es probleme mit der altdeutschen schrift geben könnte und vermutlich gibt
Herold am 6. Dezember 2008 12:03 Danke, aber wenn Du schon von Problemen schreibst, hat das wohl nicht viel Sinn.
seregwen am 6. Dezember 2008 12:06 ich habe das programm nie ausprobiert, daher kann ich es dir nicht sagen. mag sein, dass es funktioniert bzw. es bei bedarf erweiterungen o.ä. gibt. müsstest du ausprobieren ;)
Herold am 6. Dezember 2008 12:08 Ich danke Dir! Ich schaue mal nach, ob ich es kostenlos finde, denn wenn es sehr unsicher ist, ob es klappt, gebe ich natürlich kein Geld dafür aus.
seregwen am 6. Dezember 2008 12:10 verständlich, aber die meisten sachen findet man ja mittlerweile zumindest als testversionen. bzw. vielleicht findet man ja zu deinem konkreten problem auch schon eine antwort, wenn man schonmal einen softwarenamen hat
Herold am 6. Dezember 2008 12:11 Ja, danke, ich werde jetzt mal danach suchen...!
Ja, wie denn? Es ist die typische altdeutsche Schnirgelschrift, mit der damals fast alle Zeitungen geschrieben worden.