Solide Data Governance für KI-Projekte – Schlechte Daten verhageln auch die beste KI

Der Erfolg einer KI-Nutzung steht und fällt mit der Qualität ihrer Ergebnisse: Ist nur ein kleiner Teil der Antworten potenziell fehlerbehaftet, müssen Mitarbeitende viel Zeit in die Prüfung und Nachbearbeitung der Ergebnisse investieren – der Nutzen sinkt rapide. Eine Problematik, die mit Agentic AI nun noch eine weitere Dimension gewinnt. Schließlich generieren KI-Agenten nicht nur Informationen, sondern führen auf dieser Basis auch autonome Aktionen aus. Damit das Risiko von Fehlern sinkt und Vertrauen in die Technologie entstehen kann, braucht es mehr als »nur« eine hohe Datenqualität. Eine durchdachte Data Governance ist zum entscheidenden Erfolgsfaktor moderner KI-Szenarien geworden.

Ein neues Auto kaufen für nur einen Dollar? Ende 2023 gelang es einem Tech-Profi, einen GenAI-basierten Sales-Agenten eines Autohändlers so zu manipulieren, dass dieser ihm den Verkauf eines teuren Fahrzeugs zum Spottpreis zusagte. Je stärker KI Einzug in die Kernbereiche eines Unternehmens hält, desto größer werden auch die handfesten Risiken, die falsche oder unzulässige Ergebnisse der KI mit sich bringen können.

Nicht nur das Image eines Unternehmens in der Öffentlichkeit kann Schaden nehmen. Ein falscher Ratschlag im Support kann Schadensersatzforderungen auslösen, ein ungewollter Bias im KI-Recruiting-Tool eine Diskriminierungsklage nach sich ziehen. Nicht zuletzt fordert der EU AI Act heute einen verantwortungsvollen Umgang mit KI und regelt dabei ganz klar, dass Fehlverhalten auch mit hohen Strafen geahndet werden kann. Oft bleibt nur, zur Vermeidung solcher Risiken auf die konsequente Prüfung und Nachbearbeitung durch die Mitarbeitenden zu setzen. Doch der erhöhte Zeitaufwand dämpft dann die Effizienzgewinne, die eigentlich im Zentrum der KI-Nutzung stehen.

Eine KI ist immer nur so gut wie die Daten, mit denen sie gefüttert wird. Entsprechend entscheidend ist eine solide Data Governance. Mit ihr können Unternehmen dafür sorgen, dass KI-Lösungen passend zur Intention mit geeigneten, sauberen Daten gefüttert werden, um so von vornherein für eine höchstmögliche Qualität der KI-Ergebnisse zu sorgen. Insbesondere drei Faktoren spielen hierfür eine entscheidende Rolle.

Faktor 1: Saubere Datensätze
Vor Beginn der KI-Nutzung sollten Unternehmen ihren Datenfundus genau unter die Lupe nehmen. Sind die enthaltenen Datensätze akkurat, konsistent und verlässlich? Bei Bedarf müssen diese gesäubert und in einer neuen, einheitlichen Struktur standardisiert werden. Klassische Beispiele für unsaubere Datenbestände finden sich im CRM-Bereich, in dem zu ein und demselben Kunden oft mehrere Stammdatensätze bestehen. Zur Unterstützung der Datenkonsolidierung können Unternehmen auch auf spezialisierte Tools zurückgreifen, die ihnen eine strukturierte Prüfung und Bereinigung selbst hoher Mengen an Datensätzen ermöglichen.

Faktor 2: Schutz sensibler Daten
Einmal aufgenommenes Wissen kann eine generative KI nur schwerlich wieder vergessen. Entsprechend müssen Unternehmen dringend vor Beginn der KI-Nutzung definieren, auf welche Daten die KI Zugriff erhalten darf und welche nicht. Eine entsprechende Klassifizierung der Daten ist damit unerlässlich. Kritische Daten, etwa personenbezogene Daten zu Mitarbeitenden, sensible Geschäftsgeheimnisse oder vertrauliche Finanzzahlen, müssen vorab identifiziert und entsprechend gekennzeichnet werden, um zu verhindern, dass die Informationen in den KI-Wissensfundus einfließen.

Faktor 3: Dokumentation des Daten-Lebenszyklus
Schließlich ist es für einen erfolgreichen KI-Einsatz auch entscheidend zu wissen, wo die genutzten Daten entstanden sind und welchen Weg sie bis zu ihrer Nutzung durchlaufen haben. An welchen Stellen wurden sie auf welche Weise transformiert oder konsolidiert? Das Wissen über die Historie eines Datensatzes ist zum einen entscheidend, um seinen Wert für die KI-Nutzung zu bestimmen. Soll der Datensatz in seinem finalen Zustand genutzt werden oder waren die Daten auf einer vorherigen Stufe besser für die KI-Zielsetzung geeignet?

Des Weiteren ist die Nachverfolgbarkeit auch zur Qualitätssicherung entscheidend: Wird etwa ein fehlerhaftes oder verzerrendes Datenelement bekannt, das sich negativ auf die Funktionsweise der KI-Agenten auswirken würde, ist es wichtig, zu wissen, woher das Element stammt und in welche anderen, gegebenenfalls transformierten Datensätze die fehlerhafte Information ebenfalls eingeflossen ist.

Zum Putzen ist es nie zu spät. Auch wer diese Faktoren einer soliden Data Governance in der Vergangenheit nicht umfassend berücksichtigen konnte, hat noch Gelegenheit, auf den KI-Zug aufzuspringen. Auch bestehende Datenbasen lassen sich nachträglich fit machen für die Nutzung in KI-Szenarien. Während ein überschaubarer Datenbestand in einem kleinen Unternehmen kurzerhand manuell aufbereitet werden kann, sollten Anwender mit größerer Datenbasis nach Plan vorgehen.

An erster Stelle sollte dabei immer der konkrete Use Case stehen. Was soll durch den KI-Einsatz erreicht werden? Welche Daten sind dafür relevant, welche weniger? Wer ohne konkretes Ziel beginnt, riskiert, einen hohen Aufwand in die Bereinigung von Datenquellen zu investieren, die letzten Endes für den tatsächlichen KI-Einsatz keine Rolle spielen. Im Zweifelsfall empfiehlt sich die Einbindung eines spezialisierten Beratungspartners, der über Erfahrung in der Um-setzung von KI-Szenarien verfügt und entsprechend bei der -Auswahl und Aufbereitung der korrekten Datenquellen unterstützen kann.

Verlässliche Daten – verlässliche KI-Ergebnisse. Ein konsistenter, geprüfter Datenfundus ist das A und O, damit moderne KI-Use-Cases tatsächlich die Automatisierungsgrade und Effizienzgewinne ermöglichen können, die Unternehmen in der heutigen Zeit so dringend benötigen. Ein sorgfältiges Vorgehen zahlt sich dabei in jedem Fall aus: Wer zusätzliche Zeit in eine durchdachte Prüfung und Aufbereitung der eigenen Datensätze investiert, vermeidet später teure KI-Fehler.

An einer soliden Data Governance führt somit kein Weg vorbei: Nur mit ihr schaffen Unternehmen die optimale Ausgangslage, damit KI kein Risikofaktor, sondern tatsächlich zum Erfolgs-Asset im Unternehmen werden kann.

 


Anže Mis,
Data Analytics & AI Director
bei der BE-terna Group

 

 

Illustration: © Gennadii Chekalskyi, GenAI | Dreamstime.com

 

1157 Artikel zu „Data Governance“

Data Governance, Integrationsprozesse und Datenqualitätssicherung – Balance zwischen menschlicher Expertise und Automatisierung

KI-gestützte Automatisierung generiert einen Produktivitäts-Boost und es entstehen weniger Fehler, was folgerichtig zu besseren Ergebnissen und Entscheidungen führt. Muhi S. Majzoub, EVP & Chief Product Officer bei OpenText erklärt im Interview welche Vorteile und Nachteile bei der Integration von generativer KI in Unternehmensprozesse entstehen können.

Datenintensive Geschäftsmodelle brauchen professionelle Data Governance

Viele moderne Unternehmen sind einem großen Effizienzdruck unterworfen und müssen ihre Prozesse stark anpassen, um wettbewerbsfähig zu bleiben. Dabei setzen sie verstärkt auf datenbasierte Geschäftsmodelle, immer häufiger auf KI-Technologien. Verstärkte Nutzung und Abhängigkeit von digitalen Daten erfordern eine besonders akkurate, konsistente und regelkonforme Datenverarbeitung und -verwaltung. Das ideale Mittel dazu ist Data Governance, der systematische…

Fünf Hürden auf dem Weg zu einer erfolgreichen Data Governance

An einer umfassenden Data-Governance-Strategie führt heute kaum noch ein Weg vorbei – da sind sich die meisten modernen Unternehmen einig. Dass viele von ihnen aber noch weit von der tatsächlichen Umsetzung entfernt sind, belegt jetzt eine Dataversity-Studie aus dem Jahr 2020. Nur zwölf Prozent der befragten Unternehmen gaben hier an, eine entsprechende Strategie bereits vollständig…

Compliance als Haupttreiber von Data Governance

Die Datenschutzgrundverordnung (DSGVO) entfaltet ihre Wirkung und zwingt Unternehmen zur Umsetzung von Data Governance, insbesondere im europäischen Raum. Ein gut definierter Data-Govnernance-Prozess hilft, die Sichtweisen von Datensammlern und Datenkonsumenten näher zusammenzubringen und so insgesamt zu einer besseren Datenqualität beizutragen.   Das Business Application Research Center (BARC) veröffentlicht »How To Rule Your Data World«, eine weltweite…

Es braucht Data Governance um den vollen Mehrwert von Business Intelligence auszuschöpfen

Weniger als die Hälfte der befragten Unternehmen glaubt, alle Vorteile von Business Intelligence (BI) zu nutzen – entscheidender Faktor hierfür wird Governance. Qlik hat gemeinsam mit Forbes Insights die Ergebnisse einer weltweiten Befragung zum Thema Business Intelligence von mehr als 400 IT- und Business-Managern veröffentlicht. Zentrales Ergebnis der Studie »Breakthrough Business Intelligence: How Stronger Governance…

KI-Hype trifft auf Realität: Wie steht es um die Data Readiness?

Fast jedes zweite Unternehmen hat Probleme bei KI-Implementierung.   Künstliche Intelligenz (KI) gilt als entscheidender Treiber der digitalen Transformation – doch der Weg zur erfolgreichen Umsetzung ist für viele Unternehmen holpriger als gedacht. Eine aktuelle globale Umfrage von Redpoint im Auftrag von Fivetran zeigt, dass bei 42 Prozent der befragten Unternehmen mehr als die Hälfte…

Der EU Data Act – mehr Chance als Herausforderung

Der EU Data Act ist eine Verordnung, die den Zugang zu und die Nutzung von Daten innerhalb der Europäischen Union regelt. Ziel ist es, ein faires und transparentes Datenökosystem zu schaffen, in dem Unternehmen und Verbraucher mehr Kontrolle über die von ihnen generierten Daten erhalten.   Wann tritt der Data Act in Kraft? Der Data…

Fast die Hälfte der KI-Projekte in Unternehmen scheitern an unzureichender Data Readiness

Eine neue globale Umfrage zeigt steigende Kosten durch gescheiterte KI-Projekte: Komplexität der Datenbereitstellung und Wartung der Datenpipelines verbrauchen technische Ressourcen.   Fivetran, Anbieter für Data Movement, präsentiert eine neue Studie über den Einsatz von KI in Unternehmen [1]. Die von Redpoint Content durchgeführte Umfrage zeigt, dass fast die Hälfte der Unternehmen von verzögerten, unzureichenden oder…

Data-as-a-Product: Wie Sie in drei Schritten alles aus Ihren Daten herausholen

Wer das volle Potenzial seiner Daten nutzt, hat das Ruder in der Hand. Das weiß auch Jörg Hesske, Regional VP und General Manager von Denodo. Er verrät, wie Sie gerade in der zunehmend komplexen, ständig wachsenden IT-Landschaft an diesen Mehrwert gelangen.   Fragmentierte Datenquellen und Datensilos stellen für viele Unternehmen noch immer eine riesige Herausforderung…

KI- und ML-basiertes Aufbereiten und Analysieren: Big Data als Chance nutzen

Große Datenmengen stellen für Unternehmen eine immer größere Herausforderung dar. Unterstützt von cloudbasierten Daten- und Orchestrierungsplattformen bieten sie jedoch auch wertvolle Chancen. Vor allem der Einsatz von KI- und ML-basierten Technologien erweist sich für das Aufbereiten und Analysieren großer Datenmengen als hilfreich.   Hochentwickelte Technologien wie KI und ML haben das Potenzial, die weltweiten Lieferketten in…

KI-Agenten: Es fehlt an Datenqualität, Governance und Qualifikation

Die aktuelle BARC-Studie »Preparing and Delivering Data for AI: Adoption Trends, Requirements, and Best Practices« zeigt: Unternehmen setzen zunehmend auf KI – fast ein Drittel nutzt bereits KI-Agenten produktiv [1]. Doch fehlende Strukturen in der Governance, unzureichender Fokus auf Datenqualität und mangelnde KI-Kompetenzen gefährden den langfristigen Erfolg.   Die Befragten stammen aus aller Welt, mit…

Erste Schritte für ein Daten- und KI-Governance-Programm

Vertrauenswürdige KI-Ergebnisse benötigen eine Grundlage aus präzisen, transparenten und regelkonformen Daten, die im gesamten Unternehmen zuverlässig und sicher zur Verfügung stehen. Dies kann nur mit ganzheitlichen, skalierbaren und KI-gestützten Data-Governance-Lösungen erreicht werden, die es Unternehmen ermöglichen, Rollen, Verantwortlichkeiten und Prozesse für ein transparentes und sicheres Daten-Monitoring im gesamten Betrieb zu definieren. In einem Data-Governance-Framework können…

KI-Verantwortungskrise: Führungskräfte fordern eindeutige KI-Governance

Das rasante Wachstum von KI überfordert die Governance. Führungskräfte ringen um eine Balance zwischen Innovation, Verantwortung und Ethik. Das schafft rote Linien für die zukünftige Nutzung von KI.   Laut einer aktuellen Studie von NTT DATA, einem Anbieter von digitalen Business- und Technologie-Services, droht eine Verantwortungslücke die durch KI möglich gewordenen Fortschritte zu untergraben. Mehr…

Data Complexity Report: Ein entscheidendes Jahr für KI liegt vor uns

Die weltweite KI-Transformation schafft Herausforderungen in Sachen Sicherheit und Nachhaltigkeit. NetApp untersucht in seinem aktuellen Data Complexity Report, wie Unternehmen die steigende Komplexität ihres Datenmanagements für künstliche Intelligenz (KI) bewältigen [1]. Der Bericht gibt einen Überblick darüber, wie KI die globale Unternehmenswelt im Jahr 2025 und darüber hinaus beeinflussen wird – und zeigt deutlich, dass…

Das ungenutzte Potenzial von Identity Governance and Administration – Mehr als ein technisches Werkzeug

Früher war es der Wachmann am Eingang, heute schützt Identity Management Unternehmen vor unerwünschten Eindringlingen. Doch trotz der steigenden Verbreitung von IGA-Systemen, schöpfen nur wenige Unternehmen die Möglichkeiten der Technologie aus. Denn der Schlüssel zu einem erfolgreichen IGA-Einsatz offenbart sich erst, wenn man die positiven Nebeneffekte kennt, die IGA auf die gesamte Unternehmensinfrastruktur hat.

Data Risk Intelligence: Sichtbarkeit von Datenrisiken und proaktive Risikominderung neu definieren

  Data Risk Intelligence kombiniert positions- und verhaltensbasierte Datenrisikoindikatoren, um Risiken für sensible Daten proaktiv zu erkennen und zu mindern. Erste Lösung, die die Datensicherheitsfunktionen der Imperva Data Security Fabric und der Thales CipherTrust Data Security Platform vereint, um CIOs, CISOs und Datenrisikospezialisten eine äußerst zuverlässige Risikobewertung von Daten zu bieten.   Thales kündigt die…