Softwarebüro Krekeler


Pressekontakt
Softwarebüro Krekeler
Friedrich-Engels-Straße 45
15712 Königs Wusterhausen
Deutschland

PresseDesk
Tel: +49 30 53047730
E-Mail

Pressemitteilung vom 08.08.2011

OCR-Texterkennungsprogramme im Test

Transym, OmniPage und FineReader überzeugen im Zusammenspiel mit Archivierungslösung "Office Manager"

Königs Wusterhausen - Sollen gescannte Dokumente in einem digitalen Archivsystem per Volltextsuche wiederauffindbar sein, dann ist neben der Archivierungssoftware auch ein gutes Texterkennungsprogramm erforderlich. Denn Papier-Dokumente liegen nach dem Scan nur als grafisches Abbild vor - der enthaltene Text muss für die Datenverarbeitung noch ermittelt werden. Moderne Softwarelösungen verwenden intelligente Optical Character Recognition-Technologien, um die einzelnen Zeichen im Bildmuster zu erkennen. Diese werden zu Wörtern zusammengefasst und mit Wörterbüchern abgeglichen, Falscherkennungen können dann automatisch korrigiert werden.

Doch bei der Erkennungsquote trennt sich die Spreu vom Weizen, wie ein aktueller OCR-Test der DMS-Spezialisten vom Softwarebüro Krekeler zeigt. Sie stellten die Texterkennungsprogramme

im Zusammenspiel mit ihrer etablierten DMS-Lösung Office Manager auf den Prüfstand. Letztere verfügt über entsprechende Schnittstellen für die Ankopplung der OCR-Programme.

Testdokumente

Zunächst haben wir die Lösungen an einem Testdokument mit sauberem, schwarzem Druck auf weißem Hintergrund angewandt. Die zweite Vorlage war da schon anspruchsvoller: Die auf der Rückseite eines Kontoauszuges gedruckten AGB eines Kreditinstitutes mit vorhandenen Flecken und besonders kleiner Schrift. Die aufgetretenen Fehler wurden festgehalten und die Erkennungsquote ermittelt, erläutert Harald Krekeler, Inhaber des gleichnamigen Softwarebüros, den Testablauf. Während sich alle Kandidaten beim ersten Testdokument nahezu gleich gut schlugen, zeigten sich bei den AGB zum Teil deutliche Unterschiede hinsichtlich der Erkennungsgenauigkeit.

Erkennungsquoten

Mit einer Erkennungsquote von 99,0 Prozent schnitt Transym beim Vergleichstest am besten ab. OmniPage sowie der ABBYY FineReader belegten mit 98,7 Prozent beziehungsweise 98,3 Prozent den zweiten und dritten Platz. Mit merklichem Abstand folgen Microsoft Office Document Imaging (95,3 %) sowie die einzige Open-Source-Lösung im Test - Tesseract (92,9 %). Das hervorragende Ergebnis von Transym hat uns überrascht, während die Erkennungsquoten von OmniPage und FineReader den Erwartungen entsprachen. Das schlechte Abschneiden von Tesseract hingegen liegt darin, dass die Lösung nur auf die reine Zeichenerkennung, jedoch dabei von Hause aus nicht auf ein Wörterbuch zur Plausibilitätsprüfung zurückgreift, resümiert Harald Krekeler.

 

PDF Diese Pressemeldung als PDF-Dokument.



Pressemeldungen suchen

Nach Datum sortiert
2017      2016 
2015      Älter 
 
Nach Themen suchen
Programm-Updates      Neue Produkte 
Service und Support      Effektives DMS 
Sonstiges      Case Studies   Finden Sie auf officemanager.de