An Daten herrscht in den meisten Unternehmen kein Mangel, doch in der Regel sind sie über unzählige Standorte und Systeme verteilt. Zum Training von KI oder für KI-Auswertungen lassen sie sich daher nur schlecht effizient einsetzen. Unternehmen benötigen neue Ansätze, Daten effizient zu verwalten und nutzbar zu machen.
KI lebt von Daten – von vielen und hochwertigen Daten, und genau damit fangen für die meisten Unternehmen die Probleme schon an. Sie verfügen zwar über viele Daten, doch die sind über verschiedene Clouds und Speichersysteme an unterschiedlichen Standorten verteilt. Die Informationen stecken in Datenbanken, Anwendungen und File-Shares, werden möglicherweise in Data Warehouses und Data Lakes zusammengeführt und fließen durch ein vielschichtiges Geflecht aus Daten-Pipelines. Für KI-Projekte sind solche unübersichtlichen Landschaften kaum geeignet: Zum einen verschwenden die Mitarbeiter viel Zeit mit der Suche nach Daten, statt sie zu nutzen und Erkenntnisse aus ihnen zu ziehen. Zum anderen verursachen die komplexen Zugriffe durch aufwendige Pipelines und ETL-Prozesse (Extract, Transform, Load) hohe Kosten. Nicht selten ist die strukturierte Nutzung verteilter Daten gar nicht möglich. Das heißt: Unternehmen verlieren in ihren KI-Projekten viel Zeit durch die ineffiziente Datensuche und -bereitstellung und können am Ende oft doch nur einen Teil ihrer Daten mehrwertbringend einsetzen.
Hinzu kommt: Selbst dort, wo sich Daten ohne Schwierigkeiten nutzen lassen, sind die Prozesse häufig nicht auf die Bedürfnisse von Data Scientists zugeschnitten. Diese müssen die Informationen eigentlich aufbereiten, sprich: auf Qualität prüfen, bereinigen und gegebenenfalls mit weiteren Informationen anreichern. Das erzeugt hohe Aufwände oder ist schlicht nicht möglich, weshalb die KI dann direkt auf die Rohdaten zugreift. Dieses Vorgehen birgt jedoch das Risiko von ungenauen, falschen oder vorurteilsbehafteten Ergebnissen, da Datenbestände von sich aus selten perfekt sind und üblicherweise auch unvollständige, veraltete und verzerrte Informationen enthalten.
Vor allem Data Lakes, in denen riesige Datenmengen zusammenfließen und lange aufbewahrt werden, sind dafür anfällig – oft gleichen sie eher einem Sumpf als einem See. Zudem ist es schwierig, die darin gesammelten unstrukturierten und halbstrukturierten Daten mit klassischen, strukturierten Unternehmensdaten zu korrelieren. Letztlich benötigen Unternehmen daher neue ganzheitliche Ansätze beim Datenmanagement, um ihre KI- und GenAI-Initiativen erfolgreich voranzutreiben. Damit wird dieses oft stiefmütterlich behandelte Thema plötzlich strategisch wichtig.
Dezentrale Datenquellen verbinden. Ein vielversprechender und moderner Ansatz, verteilte Datenbestände in den Griff zu bekommen, sind Federated Queries. Statt zu versuchen, alle Informationen in einem zentralen Data Lake oder in anderen monolithischen Architekturen zu vereinen und dort zu analysieren, werden die verschiedenen Datenquellen wie Datenbanken, Data Lakes und Data Warehouses über eine moderne Analytics Engine verbunden – unabhängig davon, ob sie sich in der Cloud oder im Rechenzentrum befinden. Die über den verteilten Datenquellen sitzende Managementplattform der Analytics Engine sorgt für eine einheitliche Sicht auf alle Informationen und kümmert sich auch um die Data Governance, inklusive rollenbasierter Zugriffsrechte und Datenmaskierung. Auf diese Weise gewinnen Unternehmen an Transparenz und behalten die volle Kontrolle über ihre bestehenden Daten, auch wenn die zugrunde liegende Datenlandschaft unübersichtlich ist.
Der Vorteil dieses Ansatzes: Alle Systeme sind auf einheitliche Art ansprechbar, sodass Daten über verschiedene Quellen hinweg mit einer einzigen Abfrage analysiert werden können. Komplexe Daten-Pipelines werden dadurch überflüssig, was sowohl den Verwaltungsaufwand als auch die Latenz sowie die Last auf den Speichern und im Netzwerk verringert. Die Bestandssysteme bleiben bestehen und müssen nicht abgelöst werden – vorhandene Anwendungen können ihre Daten wie gewohnt speichern beziehungsweise auf sie zugreifen.
Zusätzlich besteht die Möglichkeit, einen S3-kompatiblen Objektspeicher als innovativen Speicherort und modernen Data Lake für strukturierte und halbstrukturierte Daten, die für neue Anwendungen benötigt werden, einzusetzen und in das Gesamtkonzept zu integrieren. Ein solcher Speicher ist im Vergleich zu bisherigen Lösungen äußerst kosteneffizient und liefert eine hohe Performance, die ebenso wie die Kapazität bei Bedarf unkompliziert skaliert.
Aus Daten werden Produkte. Mit einem Ansatz wie Federated Queries können Unternehmen bedeutende Fortschritte bei der Transformation hin zu einem datengetriebenen Unternehmen erreichen. Eng mit diesem Ansatz verbunden ist ein Konzept namens Data Mesh, das verschiedene moderne technologische und organisatorische Ideen vereint, darunter Federated Analytics – verteilte Datenanalysen, deren Ergebnisse in einem KI-Modell zusammengeführt werden – sowie Data as a Product und dezentrale Verantwortlichkeiten für das Teilen von Daten.
Die letzten beiden Punkte bedeuten, dass Daten im Unternehmen als Produkt betrachtet werden, das nicht von einem IT- oder Infrastrukturteam nebenbei verantwortet wird, sondern von den Datenproduzenten in den Fachbereichen oder einem auf Datenprojekte spezialisierten Center of Excellence (CoE). Die dortigen Data Product Manager und ihre Teams pflegen jeweils ihre Daten, bereiten sie auf und stellen sie als einfach nutzbares Data Product bereit. Die Nutzer erhalten also keine Rohdaten oder Datenbankzugriffe mehr, sondern saubere, qualitativ hochwertige Datensätze. Es ist eine Art der Daten-Demokratisierung, da die Hürden zur Beantwortung datenbezogener Fragen deutlich sinken.
Welche Data Products angeboten werden, hängt von den konkreten Anwendungsfällen im Unternehmen ab. Data Product Manager achten darauf, dass ihre Produkte optimal zu den Anwendungsfällen passen und halten engen Kontakt zu den Nutzern, um die Data Products gegebenenfalls weiterzuentwickeln oder neue Data Products zusammenzustellen.
Die Umsetzung dieses Konzepts ist in der Regel mit organisatorischen Veränderungen verbunden – es gibt neue Aufgaben, Zuständigkeiten und Abläufe, ja idealerweise sogar eine neue datenzentrierte Firmenkultur. Da zudem die Auswahl geeigneter Lösungen alles andere als trivial ist und Unternehmen oft auch wenig Erfahrung mit neuartigen Anwendungsfällen rund um KI und GenAI haben, ist das Thema insgesamt sehr beratungs- und dienstleistungs-intensiv.
Mehr als ein Data Lakehouse. Bei der Modernisierung von Datenmanagement-Konzepten und -Architekturen helfen Plattformen wie Dell Data Lakehouse, die weit über ein klassisches Data Lakehouse hinausgehen. Ein solches bringt üblicherweise Struktur in einen Data Lake, indem es offene Tabellenformate (OTF) einführt, die schnellere und effizientere Abfragen ermöglichen. Moderne Plattformen erweitern das um einen vollständigen Software-Stack für die Erkennung und Abfrage von Informationen bei unterschiedlichen Quellen auf Basis von Analytics-Engines wie Starburst Enterprise.
In vielen Fällen greift die Analytics-Engine dennoch nicht direkt auf die Quelldaten zu, um die Systeme nicht durch zusätzliche Abfragen zu überlasten und möglicherweise geschäftskritische Anwendungen auszubremsen. Stattdessen wird unter anderem mit Kopien und Snapshots von Datenbanken gearbeitet. Wie regelmäßig diese aktualisiert werden, hängt etwa davon ab, wie schnell sich der Datenbestand verändert oder wie häufig die Informationen tatsächlich abgefragt werden. Solche smarten Optimierungsfunktionen verhindern auch, dass immer der gesamte Datenbestand durchforstet wird. Die Engine weiß recht genau, wo sie suchen muss, welche Daten sie in einem Cache vorhalten sollte und ob es womöglich ausreicht, das Ergebnis einer früheren Abfrage zum Beispiel mittels sogenannter Materialized Views erneut auszuliefern, weil sich keine relevanten Daten verändert haben. Das alles sorgt dafür, dass Nutzer die benötigten Ergebnisse schnell erhalten und die Last auf den Systemen gering bleibt.
Schlussendlich helfen alle technischen und organisatorischen Veränderungen, die mit der Umsetzung eines Mesh-Konzepts einhergehen, dabei, Daten leichter nutzbar zu machen und schnellere Einblicke zu erhalten, und das, ohne bestehende Infrastrukturen großflächig austauschen zu müssen.
Christian Scharrer ist
Enterprise Architect und CTO Ambassador
bei Dell Technologies in Deutschland
Christian Spindeldreher ist
EMEA Data Management & Analytics Community Lead
bei Dell Technologies
Illustration: © Greyy Putra, GenAI | Dreamstime.com
1251 Artikel zu „KI Datenmanagement“
News | Business | Effizienz | Favoriten der Redaktion | Künstliche Intelligenz | Strategien | Tipps
Cleveres Datenmanagement: Strategischer KI-Einsatz

Das Jahr 2024 markierte einen Wendepunkt für die generative KI. Chat GPT und andere Akteure haben sich zu einigen der am schnellsten wachsenden Plattformen der letzten Zeit entwickelt. Doch inmitten dieser aufregenden KI-Revolution wird ein entscheidender Aspekt oft übersehen: das Datenmanagement. Ein starkes und durchdachtes Datenmanagement könnte der Schlüssel sein, um das volle Potenzial von…
News | Business Intelligence | Künstliche Intelligenz
Wann ist ein Unternehmen KI-bereit? Chancen und Herausforderungen durch modernes Datenmanagement

Über künstliche Intelligenz (KI) wird seit Jahrzehnten gesprochen, vor allem von Wissenschaftlern und Science-Fiction-Autoren. Nun kommt das Thema seit einigen Monaten wieder verstärkt in den Fokus der Öffentlichkeit, denn: KI hat mittlerweile den Hype eingeholt und beginnt sogar in der Realität die menschliche Vorstellungskraft zu überholen. Einer der Gründe hierfür liegt nach Meinung von Pure…
News | Business | Favoriten der Redaktion | Künstliche Intelligenz | Strategien | Tipps
Sechs Bausteine zur KI-Readiness: KI lebt von hochwertigen Daten und intelligenter Planung

Künstliche Intelligenz hat das Potenzial, Prozesse in nahezu allen Branchen zu revolutionieren. Doch der Erfolg jeder KI-Anwendung steht und fällt mit der Qualität der zugrunde liegenden Daten und der richtigen Vorbereitung. NTT DATA erklärt, welche Aspekte bei der Umsetzung eines KI-Projekts relevant sind. Künstliche Intelligenz hat sich in den letzten Jahren zu einem der…
News | Infrastruktur | Künstliche Intelligenz | Services
Geodatenindustrie: Wie KI die Kartenerstellung 2025 revolutioniert

KI verändert die Geodatenindustrie. Sie eröffnet neue Möglichkeiten bei der Kartenerstellung, der Fahrzeugnavigation und bei der Simulation der realen Welt für die Erprobung automatisierter Fahrsysteme. Dadurch verändert sich unser Verständnis für die Geografie unserer Welt und davon, wie Menschen und Güter effizient und sicher von A nach B gelangen. Fortschritte im Cloud Computing und…
News | Effizienz | Infrastruktur | Rechenzentrum | Strategien
Neuer Ansatz einer Datenspeicherplattform für KI und HPC im großen Maßstab

Für KI-Workloads optimierte All-Flash-basierte Ultra-Scale-Datenspeicherplattformen liefern ausreichenden Speicherdurchsatz und bieten weitreichende Skalierbarkeit. Mit der zunehmenden Verbreitung von KI-Innovationen erkennen viele Unternehmen schnell den Wert, ihre bestehenden Prozesse durch Modelltraining und Inferenz zu verbessern. Dieser Trend hat die Einführung von KI-Workflows in den Bereichen Vorverarbeitung, Training, Test, Feinabstimmung und Bereitstellung vorangetrieben. Alle diese Teilbereiche der…
Trends 2025 | News | Künstliche Intelligenz | Strategien | Tipps
Spezialisierten KI-Modellen gehört die Zukunft

Gartner prognostiziert: Bis 2027 werden Unternehmen dreimal häufiger kleine, auf spezielle Aufgaben ausgerichtete KI-Modelle einsetzen als allgemeine Sprachmodelle. Der Bedarf an kontextualisierten, zuverlässigen und kosteneffizienten Lösungen treibt den Trend hin zu spezialisierten KI-Modellen. Laut einer Prognose des Marktforschungsunternehmens Gartner werden Unternehmen bis 2027 kleine, auf bestimmte Aufgaben zugeschnittene KI-Modelle einsetzen – und das mit einem…
News | Effizienz | Künstliche Intelligenz
KI-Agenten: Das fehlende Stück im Plattform-Engineering

Die KI verändert die Softwareentwicklung rasch, aber ein großer Teil ihres Werts konzentriert sich auf die Steigerung der Produktivität einzelner EntwicklerInnen. Code-Unterstützung bringt willkommene Effizienzgewinne beim Start neuer Projekte, Frameworks aufzubauen und das »Blank Screen«-Problem zu überwinden.
News | IT-Security | Tipps
KI-generierte Ghibli-Bilder sind lustig – aber sind sie auch sicher?

Porträts im Stil von Studio Ghibli erstellen, ist der neueste KI-Trend im Internet. Diese skurrilen, von Animes inspirierten Bilder sind unbestreitbar lustig und kreativ – aber es gibt versteckte Risiken, die viele Menschen nicht erkennen. Norton, eine Cyber-Sicherheitsmarke von Gen, warnt davor, dass diese beliebten Bilderzeugungstools unbeabsichtigt persönliche Informationen – wie Schulnamen, Logos oder Straßenschilder…
News | Business Process Management | IT-Security | Künstliche Intelligenz
Daten in modernen KI-Umgebung brauchen Leitplanken und keine Schranken

Künstliche Intelligenz (KI) revolutioniert weiterhin die Geschäftswelt und hilft Unternehmen, Aufgaben zu automatisieren, Erkenntnisse zu gewinnen und Innovationen in großem Umfang voranzutreiben. Doch es bleiben Fragen offen, vor allem wenn es um die Art und Weise geht, wie KI-Lösungen Daten sicher verarbeiten und bewegen. Einem Bericht von McKinsey zufolge gehören Ungenauigkeiten in der KI sowie…
Trends 2025 | News | Trends Services | Künstliche Intelligenz
KI-Agenten: Es fehlt an Datenqualität, Governance und Qualifikation

Die aktuelle BARC-Studie »Preparing and Delivering Data for AI: Adoption Trends, Requirements, and Best Practices« zeigt: Unternehmen setzen zunehmend auf KI – fast ein Drittel nutzt bereits KI-Agenten produktiv [1]. Doch fehlende Strukturen in der Governance, unzureichender Fokus auf Datenqualität und mangelnde KI-Kompetenzen gefährden den langfristigen Erfolg. Die Befragten stammen aus aller Welt, mit…
Trends 2025 | News | Trends Security | IT-Security | Künstliche Intelligenz | Tipps | Whitepaper
Datensicherheit: KI macht Mitarbeiter zu Insider-Bedrohungen

GenAI-Daten-Uploads steigen innerhalb eines Jahres um das 30-fache; drei von vier Unternehmen nutzen Apps mit integrierten genAI-Funktionen. Netskope, ein Unternehmen für moderne Sicherheit und Netzwerke, hat eine neue Studie veröffentlicht, die einen 30-fachen Anstieg der Daten zeigt, die von Unternehmensanwendern im letzten Jahr an generative KI-Apps (genAI) gesendet wurden [1]. Dazu gehören sensible Daten…
News | Business Process Management | Digitalisierung | Künstliche Intelligenz | Strategien | Tipps
Erste Schritte für ein Daten- und KI-Governance-Programm

Vertrauenswürdige KI-Ergebnisse benötigen eine Grundlage aus präzisen, transparenten und regelkonformen Daten, die im gesamten Unternehmen zuverlässig und sicher zur Verfügung stehen. Dies kann nur mit ganzheitlichen, skalierbaren und KI-gestützten Data-Governance-Lösungen erreicht werden, die es Unternehmen ermöglichen, Rollen, Verantwortlichkeiten und Prozesse für ein transparentes und sicheres Daten-Monitoring im gesamten Betrieb zu definieren. In einem Data-Governance-Framework können…
News | Infrastruktur | Künstliche Intelligenz | Rechenzentrum
Speichertechnologie als heimlicher Held der KI-Revolution

Von autonomen Fahrzeugen bis hin zur Genomforschung verschiebt KI die Grenzen des Möglichen – die geeignete Speicherinfrastruktur trägt dazu bei, diese Entdeckungen zu beschleunigen. Im Wettlauf um die künstliche Intelligenz gibt die Speichertechnologie den Takt vor. Während Algorithmen und Rechenleistung im Rampenlicht stehen, sind es die Speicherinfrastrukturen, die KI-Durchbrüche ermöglichen. Die ersten KI-Bemühungen wurden…
News | Favoriten der Redaktion | Künstliche Intelligenz | Strategien | Tipps
Fakten statt Fiktion: Was tun gegen KI-Halluzinationen und KI-Bias?

Generative KI ist unglaublich gut darin, Informationen zu recherchieren und aufzubereiten. Unfehlbar ist sie allerdings nicht – sie kann durchaus falsch liegen oder vorurteilsbehaftete Ergebnisse liefern. Doch es gibt Maßnahmen, mit denen Unternehmen das Risiko von Halluzinationen und Bias minimieren können. Immer mehr Unternehmen setzen generative KI (GenAI) ein, um beispielsweise Mitarbeitern den Zugang zu…
Trends 2025 | News | Trends Wirtschaft | Business | Business Process Management | Digitalisierung | Effizienz | Kommunikation | Künstliche Intelligenz
Die digitale Bewerbung läuft meistens noch ohne KI

In praktisch jedem Unternehmen kann man sich digital bewerben. Zwei Drittel führen Bewerbungsgespräche auch per Videokonferenz. KI wird im Recruiting aber bislang noch kaum verwendet. Bewerbungsunterlagen per Mail oder über ein Online-Portal erhalten, das ist in deutschen Unternehmen Standard. Im weiteren Bewerbungsverlauf werden aber noch deutlich weniger digitale Tools eingesetzt – und künstliche Intelligenz…
News | Business | Kommentar | Künstliche Intelligenz
Deutschland und KI – ein schwieriges Verhältnis

Die Entwicklung und Adaption von künstlicher Intelligenz in Deutschland geht einigen viel zu langsam. Ist das wirklich so? Tatsächlich haben wir die KI weder verschlafen noch mutwillig ein- und ausgebremst. Aber es gibt eine Reihe von Besonderheiten, die der Nutzung von KI als Wirtschaftsfaktor nicht förderlich sind. Länder wie die USA und China gelten…
News | Business | Strategien | Ausgabe 1-2-2025
Datenmanagement – Digitale Innovation braucht eine Datenstrategie

Ohne ein fortgeschrittenes Datenmanagement werden die digitalen Innovationen nicht funktionieren. Die Ziele des Datenmanagements sollten sich an der Unternehmensstrategie ausrichten. Dateninitiativen müssen sinnvoll priorisiert werden. Das schafft Transparenz und alle Maßnahmen zahlen auf ein gemeinsames Ziel ein.
Trends 2025 | News | Trends Security | IT-Security | Künstliche Intelligenz | Strategien
KI-Verantwortungskrise: Führungskräfte fordern eindeutige KI-Governance

Das rasante Wachstum von KI überfordert die Governance. Führungskräfte ringen um eine Balance zwischen Innovation, Verantwortung und Ethik. Das schafft rote Linien für die zukünftige Nutzung von KI. Laut einer aktuellen Studie von NTT DATA, einem Anbieter von digitalen Business- und Technologie-Services, droht eine Verantwortungslücke die durch KI möglich gewordenen Fortschritte zu untergraben. Mehr…
News | Business Intelligence | Business Process Management | Digitalisierung | Künstliche Intelligenz | Strategien | Tipps
Drei Schlüsselbereiche für den erfolgreichen KI-Scale-up

Gartner prognostiziert, dass mangelhafte Datenqualität auch 2025 eine der größten Hürden für den Einsatz fortschrittlicher Analytik wie KI bleiben wird. Deshalb sollten sich D&A-Führungskräfte (Data & Analytics Leaders) auf drei eng verzahnte Bereiche konzentrieren, um KI-Initiativen in ihren Unternehmen erfolgreich voranzutreiben: Geschäftsergebnisse, D&A-Kompetenzen und kultureller Wandel. »KI verändert die Unternehmensplanung grundlegend, und mehr als…
News | IT-Security | Kommentar | Künstliche Intelligenz
KI-Sicherheit beginnt bei der Architektur – DeepSeek-R1 als Warnsignal

Künstliche Intelligenz revolutioniert nicht nur Geschäftsprozesse, sondern bringt auch neue, hochkomplexe Sicherheitsrisiken mit sich. Ein aktuelles Beispiel ist DeepSeek-R1, ein KI-Modell, das mit sogenanntem Chain-of-Thought (CoT) Reasoning arbeitet. Diese Methode soll die Nachvollziehbarkeit von KI-Entscheidungen verbessern, indem sie Denkschritte explizit offenlegt. Doch genau hier liegt die Schwachstelle: Unsere aktuelle Analyse zeigt, dass Angreifer diese Transparenz…