Wie funktioniert die optische Zeichenerkennung?
Das physische Dokument wird durch mit einem Multifunktionsgerät oder einem Scanner digitalisiert. Das eingescannte Dokument wird auf helle und dunkle Bereiche analysiert. Dabei werden die hellen Bereiche als Hintergrund und die dunklen Bereiche als zu erkennende Zeichen identifiziert.
Um alphabetische Buchstaben oder numerische Ziffern zu finden, werden die dunklen Bereiche weiterverarbeitet. Häufig wird nur ein Wort, ein Zeichen oder ein Textblock auf einmal erkannt.
Zwei Verfahren der Zeichenerkennung:
1.) Merkmalserkennung (Feature Matching): Anhand bestimmter Merkmale kann jedes Zeichen identifiziert werden. Dazu gehört die Anzahl der abgewickelten Linien, gekreuzte Linien oder Kurven. Beispielsweise kann der Buchstabe A als zwei diagonale Linien gespeichert werden, die in der Mitte mit einer horizontalen Linie verbunden ist. Im nächsten Schritt wird das Zeichen identifiziert und in einen Code für die weitere Verarbeitung im Computer umgewandelt.
2.) Mustererkennung (Pattern Matching): Die Software verwendet hierbei die eigene Zeichen-Datenbank, um die zu erkennenden Zeichen damit abzugleichen.
Anwendungsbereiche der OCR-Technologie?
•
Die automatische Verarbeitung von Dokumenten (Lieferscheine, Bestelldokumente, Aufträge).
•
Die Automatisierung von Dateneingabe, Verarbeitung und Extraktion.
•
Das Verarbeiten von gedruckten Dokumenten, die mit Microsoft Word etc. bearbeitet werden können.
•
Das Übersetzen von bestimmten Wörtern innerhalb eines erfassten Dokumentes in eine andere Sprache.
•
Das Aufnehmen wichtiger rechtlicher Dokumente in eine Datenbank.
•
Das Sortieren von Briefen für die Postzustellung.
•
Etc.
Welche Vorteile ergeben sich aus dieser Technologie?
Ein großer Vorteil der OCR-Technologie ist die Schnelligkeit, mit der die Software - im Gegensatz zum händischen Abtippen durch einen Mitarbeiter-, Texte erfasst. Zudem ermöglicht es uns große Textmengen zu durchsuchen, zu bearbeiten und zuzuordnen. Dank dieser Technologie spart man Zeit und umgeht eintönige Arbeitsprozesse.