OCR Datenerkennung
Das Scannen von Papierdokumenten geschieht in mehreren Schritten: Zunächst wird mit einem Scanner ein digitales Abbild erzeugt, anschliessend folgt der aufwendigste Vorgang, die Datenextraktion: Mittels leistungsfähiger OCR Software (Optical Character Recognition) werden die Inhalte automatisch erkannt.
Wie aus Dokumenten Informationen werden: OCR Datenextraktion
Bei qualitativ guten gedruckten Texten gelingt dies mit einer hohen Erkennungsrate sehr zuverlässig, bei minderer Vorlagenqualität sowie bei Handschriften stossen automatische Verfahren oft an ihre Grenzen. Der Abgleich mit vorhandenen Stammdaten (Personal, Kreditoren, Bestellungen etc.) verbessert die Resultate.
Nicht bzw. unzureichend erkannte Inhalte werden manuell ergänzt, respektive korrigiert. Die so gewonnenen Daten und Bilder (PDF, TIFF etc.) werden anschliessend in den Workflow exportiert.