Realtime Analytics – SAP HANA und Hadoop eröffnen neue Wege

h_3-4-2016_430

Industrie 4.0, Internet of Things, Digitalisierung oder datengetriebene Geschäftsmodelle sind heute keine Theorie mehr, sondern Teil des täglichen Lebens. Der Vorteil ist, dass sich die Erwartungen abgekühlt haben und auf einer realistischen Basis erste Modelle etabliert und neue erprobt werden. Technologisch vielversprechend ist eine Kombination der In-Memory-Plattform SAP HANA mit Hadoop, denn sie vereint die Vorteile der »Enterprise-Ready« Hochgeschwindigkeits-Verarbeitung mit einer »Low Budget« Data Discovery und Speicherlösung.

Traditionelle Systeme und Architekturen sind nicht optimal darauf ausgelegt, die stetig steigende Flut an Daten und Datenquellen agil meistern zu können. Big Data kann nur zu Big Business werden, wenn die richtigen Technologien und Organisationsstrukturen genutzt und etabliert werden. Zum Beispiel nutzen moderne Datenbanken zur Verarbeitung großer Datenmengen hochwertige Hardwarekomponenten und verarbeiten die Daten im Hauptspeicher (in-Memory). Diese Technologien sind extrem leistungsfähig aber auch teuer. Dagegen ist die Zielsetzung der Speicherung großer Datenmengen vor allem eine Kostenoptimierung. Dies ist nötig, da der Wert der meisten Big-Data-Anwendungsfälle erst nach dem ersten Austesten deutlich wird. Die Flexibilität, kurzfristig große Datenmengen zu speichern ohne an Budgetgrenzen zu geraten und dadurch den Leistungsdruck zu erhöhen, ist essenziell. Die Open-Source-Plattform Hadoop wurde genau zu diesem Zweck geschaffen: Die Speicherung, Verarbeitung und Analyse von sehr großen Volumen, hunderte Petabytes bis hin zu Zetabytes von Daten.

Der Clou: Verteilte Verarbeitung der Daten. Ein wesentlicher Vorzug gegenüber anderen Systemen ist, dass Hadoop nicht auf teure proprietäre Hardware für die Speicherung und Verarbeitung der Daten fußt. Der Vorteil des verteilten Filesystems erstreckt sich auch auf die verteilte Verarbeitung der Daten und kann nahezu endlos über günstige Standardserver skalieren: eine ideale Voraussetzung für die Vorbereitung der stetig wachsenden Datenflut.

Neue Wege für Big Business Analytics. Für die Anforderungen von Big Data Analytics reicht Hadoop alleine jedoch in vielen Fällen nicht aus. Für die Auswertung der un- oder semistrukturierten Daten in Kombination mit aktuellsten Business-Daten bietet sich eine In-Memory-Verarbeitung mit modernen Analyseverfahren an. Ein starkes Team sind SAP HANA und Hadoop: Die Kombination aus High-Performance-Datenbank und solider Massendaten-Plattform kann neue Wege für Business Analytics eröffnen und überzeugt außerdem durch massive Kosteneinsparungen.

Digitalisierte Preise dank Near-Real-Time Analytics. Daten von Sensoren, Netzwerken und Maschinen sowie unstrukturierte Informationen aus Fotos, Texten und sozialen Netzwerken lassen sich mithilfe von SAP HANA und Hadoop kosteneffizient und nahezu in Echtzeit auswerten und ermöglichen unzählige Anwendungsszenarien. Das Beispiel eines der größten Warenhausbetreiber zeigt, wie eine »Echtzeit-Auswertung« großer Datenmengen zur aktiven Steuerung der Marketing-Kampagnen zu 70 Prozent Kostenreduzierungen führen kann. Durch gezielte Preisanpassungen konnten die Preisberechnungen von 24 Stunden auf unter einer Stunde reduziert werden. Diese basieren auf Daten, welche durch Sensoren in den Geschäften generiert wurden, kombiniert mit Social-Media-Daten sowie Bestandsdaten und der massiven Nutzung von tausenden analytischen Modellen. Die Datenverwaltung erfolgt mithilfe von Hadoop. Die Massendaten-Plattform korreliert die verschiedenen Daten wie Anzahl Kunden, Verweildauer oder Interesse und berechnet, mit welcher Wahrscheinlichkeit ein Kunde beispielsweise einen bestimmten Pullover kauft. Dadurch können Warenströme, Lagerkosten und Preise optimiert werden.

Die Kombination aus High-Performance-Datenbank und solider Massendaten-Plattform kann neue Wege für Business Analytics eröffnen und überzeugt außerdem durch massive Kosteneinsparungen.

Die Kombination aus High-Performance-Datenbank und solider Massendaten-Plattform kann neue Wege für Business Analytics eröffnen und überzeugt außerdem durch massive Kosteneinsparungen.

Smart Grid – Big Data in der Energieversorgung. Das Thema Smart Metering/Smart Grid ist nicht erst seit der Energiewende in aller Munde und wird als Möglichkeit gesehen, Energieerzeugung und Verbrauch optimal in Einklang zu bringen. Eine große Herausforderung für die Energieversorger und Netzbetreiber sind hierbei die anfallenden riesigen Datenmengen. Nimmt man die Verbrauchswerte im Viertelstundentakt auf, entstehen pro Vertrag im Jahr ca. 36.000 Messwerte. Umgerechnet auf die fast 40 Millionen Privathaushalte in Deutschland ergibt dies etwa 1,44 Billionen Datensätze pro Jahr. Mithilfe von SAP HANA und Hadoop lassen sich aus diesen Datenmengen wertvolle Informationen generieren. Die Massendaten können geschickt verarbeitet und zusätzlich mit Forecast-Werten, beispielsweise zu Wettervorhersagen, verbunden werden. Das bietet zum einen die Möglichkeit, durch eine Steuerung des Verbrauchsverhaltens die Auslastung im Netz besser zu verteilen und zu prognostizieren. Zum anderen kann der Energieversorger den Energiebezug besser steuern und auf unvorhergesehene Ereignisse, die den Energieverbrauch beeinflussen, schneller reagieren.

Fazit. Die Vorteile der Kombination von SAP HANA und Hadoop liegen klar auf der Hand. Zum einen lassen sich durch die Auslagerung von Massendaten in Hadoop-Cluster enorme Kosten im Betrieb von SAP HANA einsparen. Zum anderen ist Hadoop über zahlreiche Schnittstellen optimal an SAP HANA angebunden. Endnutzer benötigen kein spezielles Know-how für Hadoop, da sie SAP Frontends als »Single Point of Entry« nutzen können. Ein großer Vorteil von Hadoop ist das Datenstreaming. Massendaten können direkt in Hadoop mithilfe von statistischen Modellen analysiert werden. Lediglich die Essenz dieser Auswertungen wird anschließend an SAP HANA weitergegeben. Diese Vorgehensweise ermöglicht es, riesige Datenmengen unterschiedlicher Struktur performant und in Echtzeit auszuwerten. Die Kombination von SAP HANA und Hadoop ist auch für kleinere Unternehmen mit geringen IT-Ressourcen geeignet. Denn mit Predictive Analytics bietet SAP Standardanalysen an, die es Unternehmen auch mit geringem Statistik-Know-how ermöglichen, entsprechende Modelle zu erzeugen.

 

Einsatzszenarien für Hadoop und SAP HANA

  • Analysen von Daten aus verschiedenen Datenquellen
  • Kundenverhalten vorhersagen / Kundenbindung verbessern
  • Monitoring von Maschinen / Geräten
  • Risikominimierung
  • Stimmungs- und Trendanalysen
  • Produkt- und Vertriebserfolg vorhersagen
  • Effizienz operativer Prozesse erhöhen
  • Hadoop als Near Line Storage / Archivierungs-Plattform
  • Monitoring / Optimierung von IT-Systemen

 


autor_frank_grundlichFrank Gundlich ist
Business Development Manager bei Datavard.
Er hat über 10 Jahre Erfahrung in den Bereichen
Business Intelligence, Reporting, Analytics
und Big Data.
www.datavard.com
Titelbild: © wavebreakmedia/shutterstock.com