gutefrage.net, die Ratgeber Community
Login   |  Registrieren   |  Forum |  Richtlinien & FAQ


Wie kann ich in einen abgescannten Zeitungsartikel mit alter Schrift ein bestimmtes Wort zu finden?

gefragt von HeroldHerold am 06.12.2008 um 11:50 Uhr

Also, mit anderen Worten: Mir liegen im PC abgescannte alte Zeitungsseiten vor, die in der typischen altdeutschen Schrift geschrieben worden. Ich möchte dort drin nach bestimmten Worten suchen.

Das geht natürlich nur, wenn über die gesamte(n) Seite(n) ein Texterkennungsprogramm "gestülpt" wurde.

Welches Programm eignet sich dazu?

Wichtig: Es sollte absolut nichts verunstaltet werden, also es sollten alle Worte genau an der selben Stelle stehenbleiben, Bilder und Rahmenlinen sollten ebenfalls alle erhalten bleiben usw.

Wer kann ein wirklich sehr gutes Programm empfehlen und hat selbst schon die von mir beabsichtigten Versuche gemacht?

Freue mich auf gute Antworten!


Weitere Fragen zu verwandten Themen finden Sie hier:

computer (73607)
scanner (254)
texterkennung (11)
ähnliche Fragen
Frage beantworten


GerdaG
beantwortet von GerdaG am 6. Dezember 2008 11:51
4x
Die Antwort ist hilfreich? Dann klick mich!

Kannst Du vor dem Suchen die Schriftart festlegen? Vielleicht funktioniert es so.

Kommentar von 8deeb99ed530a1c926d61c1379bde74fsmallHerold am 6. Dezember 2008 12:00

Ja, wie denn? Es ist die typische altdeutsche Schnirgelschrift, mit der damals fast alle Zeitungen geschrieben worden.


anonym
beantwortet von newcomer am 6. Dezember 2008 11:53
3x
Die Antwort ist hilfreich? Dann klick mich!

du brauchst ein lernendes OCR Programm. Hier musst du jeden Buchstaben einzeln einlernen, was fast alle guten Programme können. Nachdem alle Buchstaben eingelernt sind, läuft das reibungslos.

Kommentar von Simple_avatar2smallMrCharly am 6. Dezember 2008 11:55

sehe ich auch so

Kommentar von 8deeb99ed530a1c926d61c1379bde74fsmallHerold am 6. Dezember 2008 12:01

Danke! Welches Programm müßte ich dazu nehmen und wie läuft das genau ab?

Kommentar von newcomer am 6. Dezember 2008 12:03

suche mal in google unter OCR Software

Kommentar von 8deeb99ed530a1c926d61c1379bde74fsmallHerold am 6. Dezember 2008 12:10

Ja, man landet letztlich immer bei der aktuellsten Variante von Omnipage ("Onmipage 16") und die ist natürlich sehr teuer. Na, ich suche mal weiter...!


zzzap
beantwortet von zzzap am 7. Dezember 2008 09:21
3x
Die Antwort ist hilfreich? Dann klick mich!

Eine interessante Frage.

Die OCR-Software ( Texterkennung oder auch Optische Zeichenerkennung )müsste Fraktur-Schriften erkennen. Auf diesem Spezialgebiet gibt es nicht sehr viel.

ABBYY FineReader XIX for Fraktur

für vielleicht annähernd brauchbare Ergebnisse.

Zum Spaß mal die Preisliste mit seltsamen Lizenzen von 340,- bis 1700,- EUR .

http://esd.element5.com/product.html?productid=300002063

Kommentar von 5f317576a3559bfb30a44ee342172e70smallzzzap am 7. Dezember 2008 09:45

> Tesseract ist ein freies Texterkennungsprogramm welches bei der Google- Buchsuche verwendet wird.

http://de.wikipedia.org/wiki/Tesseract

http://books.google.de/

Angeblich ist eine teilweise Erkennung von Fraktur-Texten möglich.

Tesseract hat keine grafische Benutzeroberfläche !

Die zukünftige Entwicklung des Programms wäre zu verfolgen.

> FreeOCR

beinhaltet Tesseract und hat eine Benutzeroberfläche für Windows.

http://softi.co.uk/freeocr.htm

http://www.heise.de/software/download/freeocr/49486

Weitere freie OCR-Programme für Windows :

http://www.freeocr.net/

Kommentar von 5f317576a3559bfb30a44ee342172e70smallzzzap am 7. Dezember 2008 09:53

( Vielleicht ist das manuelle Abtippen der Texte zu Zeit noch schnellsten.? )

Kommentar von 8deeb99ed530a1c926d61c1379bde74fsmallHerold am 7. Dezember 2008 11:04

Hallo, ich grüße Dich und danke für Deine viele Mühe! Ich schaue mir alles nochmal in Ruhe an, aber ich sehe schon dass mein Vorhaben kaum umzusetzen sein wird.

Es ist natürlich schäbig, dass die Firmen, die die Möglichkeit dazu hätten, solche horrende Preise verlangen und dann sogar noch die Seitenzahl begrenzen! Die blanke Habgier!!


fourseasons
beantwortet von fourseasons am 6. Dezember 2008 13:29
2x
Die Antwort ist hilfreich? Dann klick mich!

Ohne manuelle Nacharbeit wird das wohl kein OCR-Programm leisten. Es gibt immer mal wieder Sonderzeichen, Rahmen werden verschoben etc.

Auch Omnipage wird da leider nicht so ganz ohne "Verunstaltung" funktionieren.

Aber nur um bestimmte Wörter zu suchen, dürfte es wohl funktionieren. Du behältst ja sicher das Original und experimentierst mit einer Kopie.

Kommentar von 8deeb99ed530a1c926d61c1379bde74fsmallHerold am 6. Dezember 2008 15:35

Danke für Deine Hinweise! Ich war zwischenzeitlich erstmal einkaufen.

Ja, im Moment bezieht sich meine Absicht auf das Durchsuchen abgescannter uralter Zeitungen, die ich im Internet fand. Das Original bleibt da immer erhalten. Ich dachte mir das so, dass ich immer je ein ganzes Zeitungsblatt "durch das Programm jage" und an anderer Stelle diese ganze Seite in ordentlich lesbarer Schrift (und möglichst ohne große "Verstümperung") wiederfinde.

Kleine Dinge kann man natürlich selber ausbessern. Hauptsache, die altdeutsche Schrift wird sicher erkannt und ordentlich umgewandelt!


seregwen
beantwortet von seregwen am 6. Dezember 2008 11:54
1x
Die Antwort ist hilfreich? Dann klick mich!

FineReader kann das generell...wobei es probleme mit der altdeutschen schrift geben könnte und vermutlich gibt

Kommentar von 8deeb99ed530a1c926d61c1379bde74fsmallHerold am 6. Dezember 2008 12:03

Danke, aber wenn Du schon von Problemen schreibst, hat das wohl nicht viel Sinn.

Kommentar von Be72f67a6e79cf3761791185cbcdf2acsmallseregwen am 6. Dezember 2008 12:06

ich habe das programm nie ausprobiert, daher kann ich es dir nicht sagen. mag sein, dass es funktioniert bzw. es bei bedarf erweiterungen o.ä. gibt. müsstest du ausprobieren ;)

Kommentar von 8deeb99ed530a1c926d61c1379bde74fsmallHerold am 6. Dezember 2008 12:08

Ich danke Dir! Ich schaue mal nach, ob ich es kostenlos finde, denn wenn es sehr unsicher ist, ob es klappt, gebe ich natürlich kein Geld dafür aus.

Kommentar von Be72f67a6e79cf3761791185cbcdf2acsmallseregwen am 6. Dezember 2008 12:10

verständlich, aber die meisten sachen findet man ja mittlerweile zumindest als testversionen. bzw. vielleicht findet man ja zu deinem konkreten problem auch schon eine antwort, wenn man schonmal einen softwarenamen hat

Kommentar von 8deeb99ed530a1c926d61c1379bde74fsmallHerold am 6. Dezember 2008 12:11

Ja, danke, ich werde jetzt mal danach suchen...!


Frage beantworten

Noch nicht die richtige Antwort? Dann hier in allen Fragen und Tipps suchen:




Verwandte Fragen

Verwandte Fragen


Verwandte Fragen

Verwandte Fragen
Die unter gutefrage.net angebotenen Dienste und Ratgeber Inhalte werden nicht geprüft. Die Richtigkeit der Inhalte wird nicht gewährleistet. Bitte lesen Sie hierzu auch unsere Rechtlichen Hinweise.