Der Erfolg einer KI-Nutzung steht und fällt mit der Qualität ihrer Ergebnisse: Ist nur ein kleiner Teil der Antworten potenziell fehlerbehaftet, müssen Mitarbeitende viel Zeit in die Prüfung und Nachbearbeitung der Ergebnisse investieren – der Nutzen sinkt rapide. Eine Problematik, die mit Agentic AI nun noch eine weitere Dimension gewinnt. Schließlich generieren KI-Agenten nicht nur Informationen, sondern führen auf dieser Basis auch autonome Aktionen aus. Damit das Risiko von Fehlern sinkt und Vertrauen in die Technologie entstehen kann, braucht es mehr als »nur« eine hohe Datenqualität. Eine durchdachte Data Governance ist zum entscheidenden Erfolgsfaktor moderner KI-Szenarien geworden.

Ein neues Auto kaufen für nur einen Dollar? Ende 2023 gelang es einem Tech-Profi, einen GenAI-basierten Sales-Agenten eines Autohändlers so zu manipulieren, dass dieser ihm den Verkauf eines teuren Fahrzeugs zum Spottpreis zusagte. Je stärker KI Einzug in die Kernbereiche eines Unternehmens hält, desto größer werden auch die handfesten Risiken, die falsche oder unzulässige Ergebnisse der KI mit sich bringen können.

Nicht nur das Image eines Unternehmens in der Öffentlichkeit kann Schaden nehmen. Ein falscher Ratschlag im Support kann Schadensersatzforderungen auslösen, ein ungewollter Bias im KI-Recruiting-Tool eine Diskriminierungsklage nach sich ziehen. Nicht zuletzt fordert der EU AI Act heute einen verantwortungsvollen Umgang mit KI und regelt dabei ganz klar, dass Fehlverhalten auch mit hohen Strafen geahndet werden kann. Oft bleibt nur, zur Vermeidung solcher Risiken auf die konsequente Prüfung und Nachbearbeitung durch die Mitarbeitenden zu setzen. Doch der erhöhte Zeitaufwand dämpft dann die Effizienzgewinne, die eigentlich im Zentrum der KI-Nutzung stehen.

Eine KI ist immer nur so gut wie die Daten, mit denen sie gefüttert wird. Entsprechend entscheidend ist eine solide Data Governance. Mit ihr können Unternehmen dafür sorgen, dass KI-Lösungen passend zur Intention mit geeigneten, sauberen Daten gefüttert werden, um so von vornherein für eine höchstmögliche Qualität der KI-Ergebnisse zu sorgen. Insbesondere drei Faktoren spielen hierfür eine entscheidende Rolle.

Faktor 1: Saubere Datensätze

Vor Beginn der KI-Nutzung sollten Unternehmen ihren Datenfundus genau unter die Lupe nehmen. Sind die enthaltenen Datensätze akkurat, konsistent und verlässlich? Bei Bedarf müssen diese gesäubert und in einer neuen, einheitlichen Struktur standardisiert werden. Klassische Beispiele für unsaubere Datenbestände finden sich im CRM-Bereich, in dem zu ein und demselben Kunden oft mehrere Stammdatensätze bestehen. Zur Unterstützung der Datenkonsolidierung können Unternehmen auch auf spezialisierte Tools zurückgreifen, die ihnen eine strukturierte Prüfung und Bereinigung selbst hoher Mengen an Datensätzen ermöglichen.

Faktor 2: Schutz sensibler Daten

Einmal aufgenommenes Wissen kann eine generative KI nur schwerlich wieder vergessen. Entsprechend müssen Unternehmen dringend vor Beginn der KI-Nutzung definieren, auf welche Daten die KI Zugriff erhalten darf und welche nicht. Eine entsprechende Klassifizierung der Daten ist damit unerlässlich. Kritische Daten, etwa personenbezogene Daten zu Mitarbeitenden, sensible Geschäftsgeheimnisse oder vertrauliche Finanzzahlen, müssen vorab identifiziert und entsprechend gekennzeichnet werden, um zu verhindern, dass die Informationen in den KI-Wissensfundus einfließen.

Faktor 3: Dokumentation des Daten-Lebenszyklus

Schließlich ist es für einen erfolgreichen KI-Einsatz auch entscheidend zu wissen, wo die genutzten Daten entstanden sind und welchen Weg sie bis zu ihrer Nutzung durchlaufen haben. An welchen Stellen wurden sie auf welche Weise transformiert oder konsolidiert? Das Wissen über die Historie eines Datensatzes ist zum einen entscheidend, um seinen Wert für die KI-Nutzung zu bestimmen. Soll der Datensatz in seinem finalen Zustand genutzt werden oder waren die Daten auf einer vorherigen Stufe besser für die KI-Zielsetzung geeignet?

Des Weiteren ist die Nachverfolgbarkeit auch zur Qualitätssicherung entscheidend: Wird etwa ein fehlerhaftes oder verzerrendes Datenelement bekannt, das sich negativ auf die Funktionsweise der KI-Agenten auswirken würde, ist es wichtig, zu wissen, woher das Element stammt und in welche anderen, gegebenenfalls transformierten Datensätze die fehlerhafte Information ebenfalls eingeflossen ist.

Zum Putzen ist es nie zu spät. Auch wer diese Faktoren einer soliden Data Governance in der Vergangenheit nicht umfassend berücksichtigen konnte, hat noch Gelegenheit, auf den KI-Zug aufzuspringen. Auch bestehende Datenbasen lassen sich nachträglich fit machen für die Nutzung in KI-Szenarien. Während ein überschaubarer Datenbestand in einem kleinen Unternehmen kurzerhand manuell aufbereitet werden kann, sollten Anwender mit größerer Datenbasis nach Plan vorgehen.

An erster Stelle sollte dabei immer der konkrete Use Case stehen. Was soll durch den KI-Einsatz erreicht werden? Welche Daten sind dafür relevant, welche weniger? Wer ohne konkretes Ziel beginnt, riskiert, einen hohen Aufwand in die Bereinigung von Datenquellen zu investieren, die letzten Endes für den tatsächlichen KI-Einsatz keine Rolle spielen. Im Zweifelsfall empfiehlt sich die Einbindung eines spezialisierten Beratungspartners, der über Erfahrung in der Um-setzung von KI-Szenarien verfügt und entsprechend bei der -Auswahl und Aufbereitung der korrekten Datenquellen unterstützen kann.

Verlässliche Daten – verlässliche KI-Ergebnisse. Ein konsistenter, geprüfter Datenfundus ist das A und O, damit moderne KI-Use-Cases tatsächlich die Automatisierungsgrade und Effizienzgewinne ermöglichen können, die Unternehmen in der heutigen Zeit so dringend benötigen. Ein sorgfältiges Vorgehen zahlt sich dabei in jedem Fall aus: Wer zusätzliche Zeit in eine durchdachte Prüfung und Aufbereitung der eigenen Datensätze investiert, vermeidet später teure KI-Fehler.

An einer soliden Data Governance führt somit kein Weg vorbei: Nur mit ihr schaffen Unternehmen die optimale Ausgangslage, damit KI kein Risikofaktor, sondern tatsächlich zum Erfolgs-Asset im Unternehmen werden kann.

Anže Mis,

Data Analytics & AI Director

bei der BE-terna Group

