Big Data: Standardisierung tut Not

Verzeihen Sie mir die etwas antiquierte Überschrift. Die digitale Transformation treibt viele Blüten. Cloud Services entstehen, und es wird in die Cloud verlagert, was das Zeug hält. Unternehmensprozesse »kippen um wie die Fliegen«. Als ich mich vor 20 Jahren etwas eingehender mit der Konstruktion und Entwicklung in der industriellen Fertigung beschäftigt habe, tauchte die Vision von der durchgängigen Unterstützung des gesamten Produktlebenszyklus durch die IT von Design und Konstruktion bis zum Service und zum Recycling auf. Die Idee von der Massenindividualisierung tauchte auf, und immer kleinere Losgrößen benötigten immer umfassender Produktdatenmanagementsysteme, die nicht nur wohlstrukturierte Stücklisten verwalten, sondern auch Zeichnungen – und unter Umständen eben auch den Anruf mit der Frage zum Service oder dem Verbesserungsvorschlag. Es sollten sogar interessante Service-Anliegen und Kundenideen in die Entwicklung zurückgespielt werden: »customer-driven product development«. Nach einer geraumen Zeit haben dann auch die Berater für Admin und Finance diese Ideen aufgegriffen, und mit den Social Media usw. hatte man es dann im »customer centric business« eben plötzlich mit sehr vielen Daten sehr unterschiedlicher Natur zu tun.

Für die Beherrschung dieser großen, polystrukturierten Datenmengen entstanden erste Werkzeuge für das Speichern von Daten und vor allem für das Wiederfinden, darunter das Verfahren MapReduce mit seinem Open-Source-Ableger Hadoop. Neben Hadoop haben verschiedene Data-Warehouse-, Data-Mining- und Business-Intelligence-Lösungen Software für das Verarbeiten und Visualisieren sowie das Verwalten der Ergebnisse die Anzahl der »Tiere im Big-Data-Zoo« weiter in die Höhe getrieben. Demokratisierung der Software ist hier ein schwammig verwendeter Begriff, wobei da nicht immer klar ist, wer hier was meint: Darf jeder Anwender die Funktionsweise der Software mitbestimmen, oder darf jeder, der es sich zutraut, ein bisschen mitprogrammieren?

Zunehmende Anzahl der Anbieter

Wie auch immer: An welchen Standards orientiert sich eigentlich die Big-Data-Software? Benötigen wir überhaupt eine Standardisierung? Wer im Markt aktiv ist, zeigt Matt Turck von der Venture-Capital-Firma »Firstmark« in seinen Big-Data-Landscape-Grafiken, die von Jahr zu Jahr unübersichtlicher werden.

Abbildung: Die Landschaft an Big-Data-Lösungen. Quelle: Matt Turck. Für die detaillierte Ansicht bitte auf die Grafik klicken.

 

Dem Anwender hilft die Grafik vielleicht ein klein wenig bei der Zuordnung der einzelnen Software-Tools zu einzelnen Big-Data-Aufgaben. Doch in der Regel ist es nicht einfach machbar, von einem Tool zu einem anderen zu wechseln. Das klingt zwar stark nach »freedom of choice«, also grenzenloser Freiheit. Das klingt aber auch genauso stark nach »viel Lehrgeld zahlen müssen«.

Warum ist die Zeit jetzt reif für eine Standardisierung der IT-Lösungen? Wer die eingangs genannte Landschaft für CAD/PLM-Software regelmäßig beobachtet hat, weiß, dass einige große Konsolidierungswellen viele Softwareanbieter vom Markt verschwinden ließen. Die Anwender hatten oft das Nachsehen, mussten sie doch ihre Modelle aufwendig konvertieren oder neu aufbauen. Wenn der Softwarepartner wegbricht, ist das nie angenehm. Sei es auch nur wegen im Zweifelsfalle eingebüßter Restlaufzeiten schon bezahlter Wartungsverträge.

In der Cloud ist alles anders, könnte man einwerfen, denn dann könnte der As-a-Service-Anbieter vertraglich gezwungen werden, vor dem Ableben für adäquaten Ersatz zu sorgen. Doch wie sieht es dann mit der Produktpflege von allfälligen Sicherheitslücken in Anwendungsprogrammen bis hin zu Erweiterungen auf Kundenwunsch aus? Wird dann wirklich der Cloud-Anbieter die Softwareentwicklung und -anpassung und -verantwortung übernehmen (und ein entsprechendes Vertragswerk unterzeichnen)?

Weder die Cloud noch Open Source gewährleisten einen Standard, der es dem Anwender erlaubt, einer neuen Technik zu vertrauen. Auch De-facto-Standards wie sie durch den Gebrauch bei vielen Herstellern und Anwendern entstehen, ersetzen keinen Standard. Selbst die RFCs stellen keinen Standard dar. Wie soll sich also ein Anwender auf die Versprechen der Anbieter verlassen können? Die Standards sind natürlich für einen »einfachen Betrieb« nicht unbedingt erforderlich, wohl aber wenn Hochverfügbarkeit, Geschwindigkeit, Datendurchsatz, Connectivity, mathematische Modelle der Analysen (damit die Analyse bei Lösung B eben das gleiche Ergebnis liefert wie bei Lösung A) zur Debatte stehen.

Einzelne Initiativen sind sichtbar. Vielfach beziehen diese sich auf die Standardisierung von Daten. Das klingt mitunter so, als ob man den Fahrer eines Elektro-Pkws auf das Gewicht standardisieren wolle, damit der Akku die angestrebten 180 Kilometer Reichweite auch wirklich erreicht. Hieß Big Data nicht ursprünglich auch einmal, unstrukturierte Daten zu verarbeiten? Datenformate unterliegen zudem zahlreichen Industriestandards (siehe u.a. die verschiedenen Videoformate). Aber wie sieht es mit den Speichermodellen aus? Die Anwender, die ihre zeilenorientierten Datenbanken auf die neuen spaltenorientierten Datenbanken umgestellt haben, merkten schnell, wie groß und umfassend dieser Eingriff ist. Wie sieht es aus, wenn die Daten nach als Graphen verwaltet werden?

Fazit

Die IT-Branche wird nicht darum herumkommen. Sie muss eine Standardisierung zusammen mit den Normierungsinstituten vorantreiben. Sonst werden wir noch lange von einem Tool zum nächsten springen und uns in furchtbar agilen, aber schlussendlich unproduktiven Entwicklungssprints verbrennen. Ewiges Basteln kann aber nicht die Basis einer effizienten datengetriebenen Wirtschaft sein. Insofern behalten die Begriffe der digitalen Transformationen und der industriellen Revolution ihren Sinn bei: Wir leben in umstürzlerischen Zeiten, und man weiß nicht so recht, was dabei zum Schluss herauskommt.

Holm Landrock, ISG

 


 

Hier folgt eine Auswahl an Fachbeiträgen, Studien, Stories und Statistiken die zu diesem Thema passen. Geben Sie in der »Artikelsuche…« rechts oben Ihre Suchbegriffe ein und lassen sich überraschen, welche weiteren Treffer Sie auf unserer Webseite finden.

 

Big Data Analytics – Aus Rohdaten wird Gewinn

Big Data und Data Analytics: Schritt für Schritt zur eigenen Infrastruktur

Backup für die really Big Data

Big Data machen Künstliche Intelligenz gangbar

Umsatzsteigerung mit IoT: Big Data als Wachstumsmotor richtig nutzen

Big Data ist nicht mehr nur ein Thema für Konzerne