Health-Check: Wie fit ist Ihr Data Warehouse?

In vielen Unternehmen ist das Data Warehouse in die Jahre gekommen. Gleichzeitig wachsen die Anforderungen der Fachabteilungen. Mit IoT und der Digitalisierung kommen zudem neue Herausforderungen hinzu. Ist Ihr Data Warehouse all dem noch gewachsen? Machen Sie den Health-Check.

Das Data Warehouse (DWH) bildet das Fundament für Business Intelligence und Data-Analytics-Plattformen. Es dient als zentraler Speicher für alle unternehmensrelevanten Daten, bereitet sie auf, setzt sie in Relation und stellt sie für Auswertungen zur Verfügung. Fachabteilungen ziehen daraus Kennzahlen und erstellen Berichte. Die meisten Unternehmen haben ihr Data Warehouse schon viele Jahre in Betrieb. Seit es damals aufgebaut wurde, hat sich jedoch einiges geändert. Durch die fortschreitende Digitalisierung ist das Datenvolumen enorm gewachsen. Gleichzeitig steigen die Anforderungen der Fachabteilungen. Sie benötigen ihre Auswertungen so schnell wie möglich und fordern immer wieder neue Kennzahlen ein, die erst einmal ins Data Warehouse integriert werden müssen. Oft ist das aufgrund der gewachsenen Komplexität schwierig. Erfüllt Ihr DWH noch die aktuellen Anforderungen und ist es für die Zukunft gewappnet? Die folgenden Fragen bringen es ans Licht.

 

  1. Beschweren sich Fachabteilungen, weil kritische Berichte zu lange dauern?

Die Digitalisierung setzt Fachabteilungen unter Druck. Sie brauchen ihre Kennzahlen möglichst umgehend, um schnell auf veränderte Marktbedingungen und Kundenanforderungen reagieren zu können. Wer lange auf kritische Berichte warten muss, verliert wertvolle Zeit – und das kann sich auf den Geschäftserfolg auswirken. Performance-Probleme sind daher einer der häufigsten Gründe, warum Unternehmen ihr Data Warehouse auf den Prüfstand stellen. Die Ursachen dafür können zum Beispiel in der Hardware, der Datenbank oder der Datenmodellierung liegen.

 

  1. Kommt es zu Abbrüchen beim Nachladen von Daten?

Damit Fachabteilungen immer auf die aktuellen Kennzahlen zugreifen können, muss das Data Warehouse kontinuierlich mit neuen Daten befüllt werden. Wenn es bei diesem Nachladeprozess zu Problemen kommt, stehen die Daten nicht zur Auswertung zur Verfügung. Fachabteilungen sehen dann nur die Informationen vom Vortag im System und können nicht richtig arbeiten. Solche Stabilitätsprobleme hängen oft mit Performance-Problemen zusammen. Wenn IT-Abteilungen nicht täglich kämpfen wollen, dass das Data Warehouse auch richtig befüllt wird, müssen sie die Ursachen beseitigen.

 

  1. Weichen wichtige Kennzahlen in Ihren Reports von den Daten in Quellsystemen ab?

Nur wenn die Integrität der Daten im Data Warehouse sichergestellt ist, können Fachabteilungen aus den Analysen auch die richtigen Erkenntnisse ziehen. Kommt es zu Abweichungen von Daten im DWH und in den Quellsystemen, gibt es keine verlässliche Grundlage mehr für datenbasierte Entscheidungen. Solche Unstimmigkeiten können verschiedene Ursachen haben. Vielleicht läuft in der Berechnung der Kennzahl etwas schief. Das kann passieren, wenn Prozesse nicht richtig dokumentiert sind und nicht mehr nachvollziehbar ist, was eine Kennzahl eigentlich bedeuten soll und wie sie zustande kommt. Im Finanzbuchhaltungssystem werden bei den einzelnen Buchungen zum Beispiel Skontoabzüge oder Boni vermerkt. Ist das im DWH nicht richtig abgebildet, stimmt die Gesamtumsatzkennzahl nicht mit der Aggregation der Einzelbuchungen im Quellsystem überein. Auch Stabilitätsprobleme können die Datenintegrität beeinträchtigen. Denn wenn das DWH keine aktuellen Daten zur Verfügung hat, stimmen die Berichte folglich auch nicht. Oft verschlechtert sich die Datenintegrität über die Jahre hinweg schleichend, weil das Data Warehouse durch ständige Anpassungen immer komplexer wird und sich Prozesse nicht mehr nachvollziehen lassen.

 

  1. Können Sie die historische Entwicklung von Stammdaten nicht richtig darstellen?

Stammdaten wie Kundeninformationen, Produktdaten oder Organisationsstrukturen spielen eine wichtige Rolle für die Zuordnung von Daten. Man nennt sie daher auch Dimensionsdaten. Bei der Datenmodellierung müssen Unternehmen genau überlegen, welche Attribute sie für künftige Auswertungen brauchen – zum Beispiel das Alter, den Familienstand oder den Wohnort einer Person. Stammdaten ändern sich nur selten. Wenn sie es tun, muss das jedoch in der Datenmodellierung abgebildet werden. Denn sonst stimmt die Datenhistorie nicht mehr. Ändert man zum Beispiel den Familienstand eines Kunden ohne Zeitbezug, fällt er auch für vergangenheitsbezogene Auswertungen in die Kategorie »verheiratet« und seine historischen Daten werden falsch zugeordnet. Deshalb ist es wichtig, dass Änderungen der Stammdaten stets nachvollziehbar bleiben und im Datenmodell berücksichtigt werden. Historisierungsprobleme hängen immer mit der Datenmodellierung zusammen.

 

  1. Dauert es lange, neue Anforderungen ins Data Warehouse zu integrieren?

Fachabteilungen brauchen heute Kennzahlen, an die vor einigen Jahren noch niemand gedacht hat. Denn der Markt und Kundenbedürfnisse ändern sich schnell. Laufend kommen neue Anforderungen hinzu, die im Data Warehouse umgesetzt werden müssen. Doch das ist einfacher gesagt als getan. Denn über die Jahre hinweg ist das DWH in den meisten Unternehmen kontinuierlich gewachsen und mit jeder Anpassung komplexer geworden. Umso schwieriger und zeitaufwändiger ist es, neue Anforderungen einzubinden. Wie bei einem Haus, das man einmal gebaut hat, kann man nicht beliebige Wände einreißen, sondern muss mit der bestehenden Umgebung arbeiten. Manchmal ist es erforderlich, aufwändige Schleifen zu basteln. Das wiederum kann zu Performance-, Stabilitäts- und Integritätsproblemen führen. Denn wenn Kennzahlen mehrfach im System gespeichert sind, weil sie nicht wiederverwendet werden können, kommt es auch schnell einmal zu Unstimmigkeiten.

 

  1. Ist es schwer, neue BI-Frontend-Tools auf Ihr Data Warehouse aufzusetzen?

Im Idealfall können Fachabteilungen ihre Berichte über entsprechende Frontend-Tools selbst per Mausklick anfertigen. Fehlen solche Tools, muss die IT-Abteilung die Berichte zur Verfügung stellen. Dadurch entsteht ein Engpass, und Fachabteilungen müssen unter Umständen länger auf ihre Auswertungen warten. BI-Frontend-Tools lassen sich jedoch nur auf das Data Warehouse aufsetzen, wenn klar dokumentiert ist, wo welche Kennzahl steht und welche Stammdaten verwendet werden sollen. Ist das DWH über die Jahre hinweg durch ständige Anpassungen zu komplex und unübersichtlich geworden, bringt auch das beste Frontend nichts. Im Idealfall sollte das Data Warehouse so aufgebaut sein, dass es erweiterbar und sauber dokumentiert ist. Alle Daten, die man braucht, sollten immer an derselben Stelle zu finden sein. Dann lässt sich auch ein beliebiges Frontend-Tool einbinden oder bei Bedarf austauschen.

 

Was ist besser: Sanieren oder neu aufbauen?

Wenn Sie eine oder mehrere der Fragen mit »Ja« beantwortet haben, dann braucht Ihr Data Warehouse eine Frischekur. Ob es ausreicht, das bestehende System zu sanieren, hängt vom Einzelfall ab. Manche Probleme lassen sich lösen, indem man die Hardware austauscht oder die Datenmodellierung anpasst. Ist die Struktur jedoch sehr komplex geworden, kann es besser sein, das DHW gleich komplett neu aufzubauen, statt weiter an der alten Umgebung herumzudoktern. Auch strategische Überlegungen spielen eine wichtige Rolle. In welche Richtung möchte sich Ihr Unternehmen entwickeln? Wer IoT-Projekte durchführen will, muss zum Beispiel in der Lage sein, riesige Mengen an unstrukturierten Daten auszuwerten. Dafür ist das bestehende DWH vielleicht gar nicht geeignet. Ein spezialisierter Berater kann dabei helfen, den aktuellen und künftigen Bedarf zu ermitteln, das DWH daraufhin zu überprüfen und die richtige Entscheidung zu treffen.

Martin Clement, Senior Solution Architect Analytics & Data bei Axians IT Solutions

 

 

 

 


 

Data-Warehouse-Landschaft 2018: Automatisierung wird entscheidend für Kunden sein

Neue Methoden für Business Intelligence – Agilität durch Automatisierung des Data Warehouse

Vor- und Nachteile eines Database-as-a-Service: Data Warehouse aus der Cloud

Big Data vs. Data Warehouse: Zeit für die Modernisierung

Data Lake statt Data Warehouse – Im Zuhause für Big Data erfolgreich fischen

Big Data und Data Warehouse – Datenmanagement wieder im Fokus

Compliance als Haupttreiber von Data Governance