Large Language Models (LLMs) sind voll im Trend. Ob privat oder in Unternehmen, auf LLMs basierende Chatbots wie beispielsweise ChatGPT von OpenAI generieren mit Deep-Learning-Modellen Texte in menschenähnlicher Weise. Auf Basis von massiven Mengen von Textdaten trainiert, können sie so auf viele Fragen Antworten liefern und Befehle ausführen.

Unternehmensentscheider prüfen momentan, welche Vorteile diese Sprachmodelle für ihre Organisation haben und wie man sie so schnell wie möglich implementieren kann. Konfrontiert sind sie dabei jedoch mit einer Lösungslandschaft, die teils ungeheure Use Cases verspricht und die LLM-basierte Tools als »Alleskönner« betiteln.

Für ein besseres Verständnis erläutert Mindbreeze, ein Anbieter von Appliances und Cloud-Services für Enterprise Search, angewandte künstliche Intelligenz und Wissensmanagement, wo die Technik ihre Grenzen hat und in welcher Nutzungsweise sie überhaupt im Geschäftskontext Sinn ergibt.

Ausgangsbedingungen und Einsatzzweck abwägen

Sinnhaft ist der Einsatz eines LLM-basierten Tools nur dann, wenn die digitale Transformation eines Unternehmens auch eine Infrastruktur für die vernünftige Implementierung bereitstellt. Auch müssen die Einsatzbereiche der Technologie im Unternehmen festgelegt werden, in denen sie einen echten Mehrwert schafft – beispielsweise in der Kundenkommunikation oder im Vertrieb.

Die folgenden vier Punkte zeigen, wie eine zweckmäßige Implementierung von LLMs aussieht und für welche Aufgaben sie im Unternehmen eher ungeeignet sind.

Automatisierte Verarbeitung großer Datenmengen und Texte

LLMs verfügen über die Fähigkeit, große Mengen an Textdaten schnell und effizient zu verarbeiten. Damit punkten sie als wertvolles Werkzeug für Aufgaben wie das Textmining und die Datenanalyse. Zu den typischen Einsatzfeldern gehören neben der Durchführung von Datenanalysen, die Erstellung von Berichten und die Beantwortung von Kundenanfragen. Diese Art der Automatisierung vermeidet menschliche Fehler und führt potenziell zu erheblichen Kosteneinsparungen. Wenn Unternehmen ein LLM zur Automatisierung dieser Aufgaben nutzen, lassen sich aufwendige manuelle Arbeitsschritte einsparen.

Maßgeschneidert für konkrete Einsatzszenarien

LLMs überzeugen durch die Möglichkeit, sie breit in den unterschiedlichsten Geschäftsbereichen mit spezifischen Geschäftsanforderungen einzusetzen. Eine zusätzliche Antwortschärfung kann beispielsweise mit RAG (Retrieval-Augmented-Generation) erreicht werden. RAG bietet eine Möglichkeit, die Leistung eines LLMs durch gezielte Informationen zu verbessern, ohne dabei das zugrunde liegende Modell selbst zu verändern. Je detaillierter und geschärfter das LLM, desto besser die generierte Antwort und damit auch die Relevanz für Anwender. Öffentliche Modelle wie ChatGPT, Microsoft Copilot oder Google Bard, haben meist keinen Zugang zu internen Unternehmensdaten, die Anwender beispielsweise zum Erstellen eines Angebots brauchen.

Wahrscheinlichkeiten sind keine Wahrheiten

Der Output eines LLMs erfolgt auf Basis von Wahrscheinlichkeiten, nicht unter Berücksichtigung des Wahrheitsgehalts. Wenn es nämlich lediglich berechnet, welches Wort wahrscheinlich als Nächstes folgt, kann es zu unwahren Aussagen kommen, die man auch als »Halluzination« bezeichnet. Diese können teilweise verblüffend wahr in ihrer Formulierung klingen, sodass ein Fehler nicht beim ersten Hinsehen entdeckt werden kann. Unternehmen können das einschränken, indem sie dem Sprachmodell einen Kontext für die Antwortfindung bieten, wie beispielsweise eine Auswahl an Textdokumenten. Generieren LLMs nur Antworten aus ausgewählten Daten, ist das Risiko für Halluzinationen bereits reduziert.

Kein Mehrwert ohne geeignete Datenbasis

Die Versuchung ist groß, LLMs sofort einzusetzen, blickt man auf die Vorteile, die LLMs mit sich bringen. Allerdings verfehlen selbst die besten KI-gesteuerten Tools ohne geeignete Datenbasis ihren Zweck. Hintergrund: Die Fähigkeit einer KI richtige Antworten zu geben, hängt von der Qualität der Daten ab, aus denen sie Informationen bezieht. Hinzu kommt die Frage nach der erforderlichen IT-Infrastruktur, um ein LLM effektiv zu nutzen. Um also nachhaltig die Weichen für eine effiziente Nutzung zu stellen, ist es wichtig Innovationen im Blick zu behalten und die Digitalisierung grundsätzlich im Unternehmen voranzutreiben.

Dass LLMs ihren Anwendern in vielen Einsatzszenarien schon heute großen Mehrwert bieten, zeigt die Praxis. Dennoch belegen die geschilderten Punkte, warum es darauf ankommt, die Grenzen der Technologie vor der Nutzung im Arbeitsalltag genau zu kennen. Daher ist es für Unternehmen von Vorteil, vor dem Einsatz generativer Sprachmodelle erfahrene Partner an Bord zu holen, die sie bei der Implementierung beraten und unterstützen.

Die Grenzen der großen Sprachmodelle für KI

Künstliche Intelligenz (KI) ist eine der wichtigsten und spannendsten Entwicklungen unserer Zeit. Mit KI können wir komplexe Probleme lösen, neue Erkenntnisse gewinnen und unsere Kreativität entfalten. Doch KI ist nicht perfekt und hat auch ihre Grenzen. Das gilt besonders für die großen Sprachmodelle, die in den letzten Jahren immer mehr Aufmerksamkeit erregt haben.

Sprachmodelle sind Computerprogramme, die aus großen Mengen von Texten lernen, wie Sprache funktioniert und wie man sie verwendet. Sie können dann Texte erzeugen, analysieren oder übersetzen, die zu einem bestimmten Thema oder Zweck passen. Sprachmodelle werden zum Beispiel eingesetzt, um Chatbots zu erstellen, die mit Menschen kommunizieren können, oder um Inhalte für Webseiten oder soziale Medien zu generieren.

Die großen Sprachmodelle, wie GPT-3 von OpenAI oder BERT von Google, sind besonders leistungsfähig und vielseitig. Sie basieren auf tiefen neuronalen Netzen, die aus Milliarden von Wörtern bestehen und viele verschiedene Aspekte der Sprache erfassen können. Sie können oft erstaunlich flüssige und kohärente Texte produzieren, die wie von Menschen geschrieben wirken.

Doch diese Technologie ist kein Alleskönner und hat auch ihre Grenzen. Zum einen sind die großen Sprachmodelle sehr teuer und aufwendig zu trainieren und zu betreiben. Sie benötigen enorme Mengen an Rechenleistung und Energie, die nicht für alle zugänglich sind. Zum anderen sind die großen Sprachmodelle nicht immer zuverlässig oder ethisch. Sie können Fehler machen, falsche oder irreführende Informationen verbreiten oder diskriminierende oder schädliche Inhalte erzeugen.

Einige der Herausforderungen und Risiken der großen Sprachmodelle sind:

Mangel an Verständnis: Die großen Sprachmodelle lernen aus Texten, ohne deren Bedeutung oder Kontext zu verstehen. Sie können daher nicht zwischen Fakten und Meinungen unterscheiden, logische Schlüsse ziehen oder kritisch denken. Sie können auch nicht erklären, wie sie zu ihren Ergebnissen kommen oder wie sicher sie sich sind.

Mangel an Qualität: Die großen Sprachmodelle können zwar oft flüssige und kohärente Texte erzeugen, aber nicht immer sinnvolle oder relevante. Sie können sich wiederholen, widersprechen oder vom Thema abweichen. Sie können auch grammatikalische oder orthografische Fehler machen oder unpassende Wörter oder Ausdrücke verwenden.

Mangel an Verantwortung: Die großen Sprachmodelle spiegeln die Daten wider, aus denen sie lernen. Wenn diese Daten verzerrt, unvollständig oder fehlerhaft sind, können die Sprachmodelle auch verzerrte, unvollständige oder fehlerhafte Inhalte erzeugen. Sie können zum Beispiel Vorurteile oder Stereotype verstärken, Hassrede oder Gewalt fördern oder Urheberrechte oder Datenschutz verletzen.

Diese Grenzen bedeuten nicht, dass wir die großen Sprachmodelle verwerfen oder verbieten sollten. Sie bedeuten aber, dass wir sie mit Vorsicht und Verstand einsetzen sollten. Wir sollten uns bewusst sein, dass sie nicht alles können und nicht alles wissen. Wir sollten ihre Ergebnisse überprüfen und hinterfragen. Und wir sollten ethische Prinzipien und Richtlinien befolgen, um sicherzustellen, dass sie dem Wohl der Menschen und der Gesellschaft dienen.

