Technologien zur optischen Zeichenerkennung sollen künftig von den Durchbrüchen im Bereich der künstlichen Intelligenz (KI) profitieren – das haben sich die Partner des Anfang Juli gestarteten Forschungsprojekts »Deep learning based optical character recognition – kurz: DeepER« zum Ziel gesetzt.
Im Rahmen des vom Bundesbildungsministerium geförderten Projekts arbeiten das Fraunhofer-Institut für Intelligente Analyse- und Informationssysteme IAIS, die CIB software GmbH und die Mentana Claimsoft GmbH an einer neuen Software zur Dokumentenanalyse. Dabei sollen selbstlernende intelligente Systeme – basierend auf Deep-Learning-Methoden – einen erheblichen Technologiesprung bringen. Ziel ist es, die Fehlerraten beim Erkennen von Buchstaben, Wörtern, Texten oder Bildern deutlich zu verringern, um so an die Leistungsfähigkeit der menschlichen Interpretation heran zu reichen. Kern des Vorhabens ist die Entwicklung einer »OCR-Engine«, die auch bei der Auswertung von großen Informationsmengen keine oder möglichst wenige Fehler produziert.
Optical Character Recognition (OCR) wird unter anderem bei der Digitalisierung von Bibliotheksinhalten, Zeitungsarchiven oder Versicherungsdokumenten eingesetzt. In vielen Fällen reicht es aus, wenn die digitalisierten Dokumente bis zu 99 Prozent richtig erfasst werden – zum Beispiel, um Papierdokumente über Suchmaschinen zugänglich zu machen. Bei rechtlich und finanziell relevanten Dokumenten bedeutet aber selbst eine Erkennungsrate von 99,9 Prozent je Zeichen, dass jede Dokumentseite einen Fehler hat – hier leistet der Mensch erheblich mehr.
Selbstlernende Technologien erleichtern Verwaltungsprozesse
»Unser Ziel, Verwaltungsprozesse im privaten Bereich und in Großunternehmen zu automatisieren, kann durch diese neuartige OCR-Engine erheblich weiterentwickelt werden. Mit der Web-Anwendung CIB doXisafe können Privatanwender ihre Dokumente – in einer Vielzahl von Formaten – von überall ohne Installation ablegen, austauschen und im integrierten CIB doXiview ohne Download anzeigen lassen. In diesem Viewer lässt sich für einige Formate eine Texterkennung durchführen, das Ergebnis bearbeiten und als durchsuchbares PDF bereitstellen. Über diese Produkte kann der User aktiv die Qualität der OCR verbessern, indem er mit seinen Dokumenten die für das Deep Learning erforderliche Big Data erweitert«, sagt Ulrich Brandner, Geschäftsführer der CIB software GmbH.
Deep-Learning-Technologien für den deutschen Mittelstand
»Anwendungen in der Sprach- oder Gesichtserkennung – wie Siri oder Google Voice Search – profitieren bereits von Deep Learning. In Deutschland finden die technologischen Fortschritte der künstlichen Intelligenz jedoch eher im Forschungsbereich statt und werden noch viel zu selten in die Anwendung gebracht. Mit der Entwicklung einer OCR-Engine wollen wir Deep-Learning-Technologien auch für die Wirtschaft und insbesondere den Mittelstand nutzbar machen«, ergänzt Joachim Köhler, Abteilungsleiter am Fraunhofer IAIS. Er rechnet dabei mit großen Fortschritten für die OCR-Technologien, die in den letzten Jahren hinsichtlich der Leistungsfähigkeit stagniert haben. Hier existieren erst einige wenige kommerzielle Anwendungen und Open-Source-Lösungen.
Die OCR-Engine wird zunächst in das bestehende Produktportfolio der CIB software GmbH eingebaut und getestet. Darüber hinaus soll sie zunächst für den deutschen Markt anderen Unternehmen über ein Lizenzmodell zur Verfügung gestellt werden. Gefördert wird das Projekt DeepER vom Bundesministerium für Bildung und Forschung BMBF im Rahmen der Förderinitiative »KMU-Innovativ«. Diese unterstützt Spitzenforschung im deutschen Mittelstand. Projektstart war der 1. Juli 2016, die Laufzeit beträgt 27 Monate.
Deep Learning und Supercomputing für selbstfahrende Automobile
Fakt statt Fiktion: Die rasche Verbreitung intelligenter Maschinen
Interview zu aktiven Wissensdatenbanken – Kontext-Wissen entlang der Service-Prozesse
Digital Workplace – High Performance dank kollaborativer und intuitiver IT