Aus Texterkennung das Beste herausholen

© shutterstock.com

E-Invoicing setzt sich in Deutschland weiter durch. Hierbei werden Rechnungsinformationen aus maschinenlesbaren Formaten wie XML automatisch in nachfolgende Systeme übertragen. Damit schwindet auch die Bedeutung von Software für automatische Texterkennung (Optical Character Recognition = OCR), die Inhalte aus Papier und PDF ausliest. Als Brückentechnologie wird OCR jedoch noch eine ganze Weile bestehen, denn so schnell werden einfache Rechnungs-PDFs nicht verschwinden. Selbst Papierrechnungen werden künftig noch versendet werden, wenn auch nur in geringem Umfang. Wo E-Invoicing noch nicht die Norm ist, lohnt es sich für Unternehmen genauer auf die OCR zu schauen. Denn je höher die Qualität der Beleglesung, desto optimierter läuft die Rechnungsverarbeitung. Hierfür sind einige Grundregeln zu beachten. 

OCR überbrückt den Medienbruch zwischen Papier bzw. PDF und ERP-System. Sie erkennt in Dokumenten Formen, Muster (z.B. eine Tabellenstruktur), Buchstaben oder Zahlen, interpretiert sie und versucht, daraus Worte oder Werte zu bilden, die sie an das nachfolgende System weitergibt. Damit dies möglichst fehlerarm funktioniert, muss die OCR-Software leistungsfähig sein. Doch auch sie stößt an ihre Grenzen, wenn der Input qualitativ minderwertig ist. Dabei erfordert es nicht viel, die Erkennungsrate und somit die Ergebnisse der OCR bzw. das manuelle Nacharbeiten deutlich zu verbessern. Wenn die Erkennungsraten zu niedrig ausfallen, bieten sich folgende Maßnahmen an, die Ergebnisse zu verbessern. Unsere Tipps:

Tipp 1: Bitten Sie Ihre Lieferanten um PDF-Rechnungen

Für PDF-Dokumente ist die Erkennungsrate in der Regel deutlich höher als für eingescannte Papierbelege. Daher sollte man seine Lieferanten darum bitten, von Papier auf PDF umzustellen. Gerade wenn sie noch keine maschinenlesbaren Rechnungen im XML-Format liefern müssen, sind die meisten Lieferanten dazu heute bereit. Der Empfänger spart sich damit das Einscannen und damit bereits die erste Fehlerquelle.

Tipp 2: Achten Sie auf die Belegqualität

Eingehende Papierbelege sind pfleglich zu behandeln und frühzeitig einzuscannen. Eingangsstempel, handschriftliche Anmerkungen oder Haftnotizen haben darauf nichts zu suchen. Muss ein Stempel unbedingt sein, diesen am besten immer an derselben Stelle platzieren. Auch die typischen Gebrauchsspuren, die entstehen, wenn ein Papierbeleg seinen Weg über die Schreibtische nimmt, verschlechtern die Scanergebnisse. Deshalb sollte man einen zentralen Posteingang einrichten, an dem Belege direkt gescannt werden. An diesen sollten Lieferanten ihre Rechnungen schicken, nicht zu Händen einzelner Beschäftigter.

Tipp 3: Vereinbaren Sie Spielregeln mit Ihren Lieferanten

Das Layout einer Rechnung hat großen Einfluss auf die Beleglesungsergebnisse. Kopfdaten und Zahlungsinformationen sind die wichtigsten Informationen; der Absender sollte sie daher groß und gut lesbar aufbringen. Schattierungen, Hintergrundfarben, Wasserzeichen und dergleichen lassen ein Dokument hochwertig aussehen, erschweren aber seine Lesbarkeit. 

Tipp 4: Geben Sie der OCR einen festen Rahmen

Zunächst ist darauf zu achten, dass wirklich nur Rechnungen und keine anderen Dokumente in den OCR-Prozess eingehen. Vorsortieren von Belegen (etwa nach Buchungskreisen) unterstützt, da z.B. die Angabe der falschen Firmierung ein typischer Fehler auf Rechnungen ist und eine nachträgliche Stornierung des Belegs im Workflow immer Aufwand verursacht. Auch empfiehlt es sich, die einzelnen Rechnungen durch Aufbringen von Nuller-Barcodes voneinander zu trennen. Sonst weiß die OCR nicht mit 100%iger Sicherheit, wo eine Rechnung endet und die nächste anfängt, bzw. kann sie nur schwer selbstständig Anhänge (wie AGB, Lieferscheine usw.) herausfiltern. 

Tipp 5: Bereinigen Sie die Stammdaten im Zielsystem 

Hohe Stammdatenqualität ist ein zentraler Schlüssel zur Verbesserung der Erkennungsquote. Insbesondere Dubletten verhindern, dass Informationen korrekt zugeordnet werden können. Außerdem sollte man die Kreditorenerkennung nicht nur an einem Wert der Stammdaten festmachen, sondern mehrere Kriterien nutzen. Zum Beispiel zusätzlich zur Bankverbindung noch Firmenname, VAT-ID oder Telefonnummer. 

Tipp 6: Nutzen Sie die Features Ihrer Rechnungsverarbeitungssoftware

Bei der OCR-Optimierung unterstützen neben den oben aufgeführten Tipps ebenfalls auch die Features und Einstellungsmöglichkeiten, die eine Lösung zur Rechnungseingangsbearbeitung bietet – wie die der xSuite. Sie beinhaltet ein Lieferanten- oder Feldtraining basierend auf Machine Learning-Algorithmen und kann Fehlertoleranzen einräumen. Über das Tool xSuite Capture Analyzer lässt sich zudem nachvollziehen und auswerten, welche Felder bei der Validierung eines Belegs nachträglich geändert wurden. So stellt man schnell fest, wenn es wiederkehrende Muster gibt – z.B. bei einem bestimmten Kreditor eine Information nie gefunden wird – und kann entsprechend gegensteuern. 

Resümee

E-Invoicing gehört die Zukunft. Und dennoch ist es empfehlenswert, sich noch heute den OCR-Prozess für Rechnungen vorzunehmen. Bei einem hohen Volumen an täglich eintreffenden Rechnungen führen oftmals kleine Verbesserungen bereits zu signifikanter Arbeitserleichterung. Die xSuite Group bietet eine solche Überprüfung der OCR als Service an. Resultat sind bessere Ergebnisse der Beleglese-Software und damit optimierte Geschäftsprozesse.

 


Dina Haack,
Head of Marketing,
xSuite Group GmbH

 

 

xSuite ist Softwarehersteller von Anwendungen für dokumentenbasierte Prozesse und stellt weltweit standardisierte, digitale Lösungen bereit, die ein einfaches, sicheres und schnelles Arbeiten ermöglichen. Die Automatisierung wichtiger Arbeitsprozesse in Verbindung mit einem durchgängigen Dokumentenmanagement stehen im Mittelpunkt. Kernkompetenz ist die Eingangsrechnungsverarbeitung innerhalb von SAP für den Mittelstand, Konzerne und öffentliche Auftraggeber. Ergänzt wird dies durch Anwendungen für Einkaufs- und Auftragsprozesse sowie Archivierung. Die Software wird in der Cloud, on-premises oder hybrid betrieben. xSuite liefert alles aus einer Hand (Softwarekomponenten und Dienstleistungen). Regelmäßige SAP-Zertifizierungen bestätigen den hohen Qualitätsstandard. Sie gelten für verschiedene Lösungen und Einsatzumgebungen von SAP. Mit xSuite werden pro Jahr mehr als 80 Millionen Dokumente verarbeitet. Über 300.000 User nutzen die Software.