Cebit 2016: Wenn die Suchmaschine mitdenkt und riesige Textbestände automatisch analysiert

fotos images cc-by-sa 3.0 wikipedia

Wer den Aktienkurs eines Unternehmens vorhersagen will, wertet dafür Nachrichtenportale und soziale Medien aus. Für diese Recherche gibt es mittlerweile viele Dienstleister, die ihre Suchmaschinen mit passenden Schlagworten füttern. Sie stoßen jedoch schnell an Grenzen, wenn mehrdeutige Begriffe nur in schwammig formulierten Zusammenhängen erscheinen. Saarbrücker Informatiker haben daher eine Technologie entwickelt, die mit Hilfe von Künstlicher Intelligenz die Suche in großen Textbeständen wesentlich verbessert. Das neue Verfahren unterstützt auch Autoren bei der Recherche und beim Schreiben von Texten, indem es automatisch Hintergrundinfos anzeigt und passende Weblinks vorschlägt.

Die Firma Ambiverse, eine Ausgründung des Max-Planck-Instituts für Informatik in Saarbrücken, stellt die neue Technologie vom 14. bis 18. März auf der Computermesse Cebit in Hannover am saarländischen Forschungsstand vor (Halle 6, Stand 28).

Auch im Zeitalter von Diensthandys und firmeninternen Chatrooms werden die meisten Informationen in Unternehmen nicht über das gesprochene Wort, sondern über Mails, Datenbanken und interne Newsportale ausgetauscht. »Laut einer Marktanalyse des Medienunternehmens Gartner nutzen derzeit jedoch nur ein Viertel der Unternehmen weltweit automatisierte Methoden, um ihre Textbestände zu analysieren und besser zu verstehen. In fünf Jahren werden es nach Gartners Schätzungen mehr als die Hälfte sein, da die Datenmengen in Firmen kontinuierlich wachsen und es immer aufwändiger wird, diese sinnvoll zu strukturieren und mit Erfolg zu durchsuchen«, sagt Johannes Hoffart, Forscher am Max-Planck-Institut für Informatik und Gründer der Firma Ambiverse. Sein Team hat daher eine Technologie für die Analyse von großen Textbeständen entwickelt, bei der viel Rechenpower und Künstliche Intelligenz im Hintergrund buchstäblich »mitdenkt«.

»Wir greifen bei unseren Textanalysen auf frei verfügbares Wissen zurück, zum Beispiel auf Wikipedia oder große Nachrichtenportale im Internet. Dieses können wir mit unternehmensspezifischem Wissen anreichern, etwa aus Produktkatalogen oder dem Schriftverkehr mit Kunden«, erläutert Hoffart. Über komplexe Rechenverfahren werden die Texte dann genauer durchleuchtet und mit Hilfe von linguistischen Werkzeugen analysiert. »Wir können dann Firmen und Branchen einzelnen Kategorien zuordnen und zum Beispiel untersuchen, wie sich die eigene Produkte im Vergleich mit den Angeboten der Konkurrenz im Markt positionieren konnten«, sagt Hoffart. Die Herausforderung sei dabei, dass die Namen von Unternehmen oder Produkten meist nicht nur einmal auf der Welt vergeben werden, sondern in verschiedenen Bedeutungen und in vielfältigen Zusammenhängen erscheinen.

»Unsere Technologie hilft dabei, automatisiert die richtigen Bezüge herzustellen«, erklärt der Informatiker. Der Name Paris steht zum Beispiel nicht nur für die Stadt des Lichts und die Hauptstadt Frankreichs, sondern bezieht sich auch auf die griechische Mythologie und ein prominentes Partygirl mit deutschen Vorfahren, das millionenfach im Internet auftaucht. »Nur wenn es gelingt, diese verschiedenen Bedeutungen eines Namens oder eines Sachverhalts richtig zuzuordnen, kann man riesige Textbestände sinnvoll durchsuchen«, so Hoffart. Die von seinem Team entwickelte intelligente Suchmaschine lernt dabei laufend dazu und ordnet automatisch neue Textinhalte den passenden Kategorien zu. »Die Rechenverfahren sind daher auch für Firmen interessant, die Onlinemedien und soziale Netzwerke auswerten, um etwa den Bekanntheitsgrad eines Produktes oder den Erfolg einer Marketingkampagne zu messen«, nennt Hoffart als weiteres Beispiel.

Das Spin-Off-Unternehmen Ambiverse wird auf der Computermesse Cebit außerdem einen intelligenten Editor vorstellen, der Autoren bei der Recherche und dem Schreiben von Texten unterstützt. Wer dort die Eingabemaske mit neuem Text füttert, bekommt zum Beispiel Hintergrundinformationen aus firmeninternen Leitfäden oder auch aus Internetquellen zur Verfügung gestellt. »Im Text werden zudem wichtige Begriffe automatisch verlinkt und weitere Recherchemöglichkeiten eingeblendet«, so der Informatiker.

Am saarländischen Forschungsstand auf der Cebit (Halle 6, Stand D 28) werden Besucher die Möglichkeit haben, in einem Frage-und-Antwort-Spiel gegen die Künstliche Intelligenz von Ambiverse anzutreten. Ambiverse wird durch das Programm EXIST-Forschungstransfer des Bundesministeriums für Wirtschaft und Energie unterstützt.

Weitere Informationen: www.ambiverse.com