Pressemitteilung vom 10.07.2012
Texterkennungs-Ergebnisse verbessern
OCR-Software im Office Manager
Königs Wusterhausen – Die effiziente Verwaltung digitaler Dokumente und gescannter Papierbelege ist mit der europaweit etablierten DMS-Lösung Office Manager in vielen Unternehmen bereits Realität. Dokumente liegen - jederzeit von autorisierten Mitarbeitern abrufbar - in einem zentralen Archiv und werden mittels Suche nach Schlagwörtern und Kataloginformationen schnell und zuverlässig wiederaufgefunden.
Da gescannte Dokumente jedoch erst einmal nur als Grafik-Abbild ihrer Papiervorlage vorliegen, ist für eine funktionsfähige Volltextsuche eine Texterkennungssoftware notwendig.
Beim Scannen eines Papierdokumentes wird quasi ein digitales Foto erzeugt. Für eine Volltextsuche müssen die enthaltenen Texte zuerst mit Hilfe
einer OCR-Software erkannt und erfasst werden
, erklärt Harald Krekeler, Geschäftsführer
des Softwarebüro Krekeler, die technischen Hintergründe. Daher wird der Office Manager bereits von Hause aus mit der
Texterkennung "Tesseract OpenSource-Engine" ausgeliefert. Noch bessere Resultate können Anwender jedoch mit der Nutzung kommerzieller
Lösungen wie zum Beispiel "ABBYY FineReader" oder "OmniPage" erreichen.
Downloadmöglichkeit für Microsoft OCR
Als kostenlose Alternative empfehlen wir das Hilfsprogramm Microsoft Office Document Imaging (MODI)
, so Krekeler.
MODI bietet gute Erkennungsergebnisse und kann vom Office Manager direkt angesprochen und gesteuert werden. Da
das Hilfsprogramm aber nur mit den MS Office-Versionen 2003 und 2007 ausgeliefert wurde, sollten Anwender späterer Office-Versionen die
Lösung
von der Microsoft-Website laden. Die MODI-OCR ist Bestandteil von SharePoint Designer 2007
und kann durch entsprechende Auswahl im Setup auch einzeln installiert werden. Sie ist unabhängig vom MS Office lauffähig.
Siehe auch
MODI-Download und Aktivierung im Office Manager
Pressemeldung vom 8.8.2011: Test von OCR-Programmen
Pressemeldung vom 12.1.2011: Tesseract 3.0
OCR-Supportartikel im Blog