OCR – Optical Character Recognition

Auf einen Blick: OCR

Optical Character Recognition, oder auf Deutsch „Texterkennung“, ist eine Software. Sie erkennt automatisch Text auf Bildern und gescannten Dokumenten, die in verschiedenen Formaten wie PDF, PNG oder JPEG vorliegen können. Die Software identifiziert die darauf dargestellten Buchstaben und setzt sie zu Wörtern zusammen. So wird aus dem Bild eine bearbeitbare und durchsuchbare Datei.

OCR-Software wird meistens in Kombination mit einem Scanner genutzt. Der Scanner liefert eine Bilddatei, die aus sogenannten Rastergrafiken – also tabellarisch angeordneten farbigen Punkten – besteht. Zuerst wird die Datei in ihre einzelnen Elemente wie Text, Bilder und Tabellen aufgegliedert. Der Text wird in Zeilen, dann in Wörter und schließlich in Zeichen zerlegt. Diese Zeichen werden anschließend mittels Merkmals- und Mustererkennung identifiziert und nach der erfolgreichen Erkennung wieder als Text zusammengefügt. Die meisten OCR-Softwares beinhalten ein umfangreiches Wörterbuch und ein Grammatikprogramm, mit dem sie die gebildeten Sätze auf ihre Richtigkeit überprüfen können.

Die ICR (Intelligent Character Recognition) versteht sich quasi als Upgrade der OCR. Sie kann auch handgeschriebenen Text erkennen und in maschinenlesbare Zeichen konvertieren. Mehr über ICR erfahren Sie hier.