»Daten machen möglich, was bisher unmöglich war«

Anlässlich der Cloudera Sessions in den Münchner Eisbach Studios sprach manage it mit Mike Olson, einem der Gründer von Cloudera und aktuell als Chief Strategy Officer im Vorstand des Unternehmens, über Machine Learning, IoT und moderne Datenanalyse.

 

Unternehmen haben heute branchenunabhängig immer mehr mit Daten zu tun. Cloudera hat einmal als Hadoop-Distributor angefangen und bietet heute den gesamten »Data-Management-Stack«: Daten erfassen, speichern, verarbeiten, analysieren und Erkenntnisse daraus ableiten. Wo sehen Sie Clouderas Aufgabe und welches Ziel verfolgt das Unternehmen?

Wir glauben, dass morgen mit Daten Dinge möglich sind, die heute noch unvorstellbar sind. In den letzten neun Jahren haben wir spannende Veränderungen gesehen: Ärzte können durch neue Diagnoseansätze Krankheiten früher erkennen und dank moderner Techniken bei der Entwicklung bessere Medikamente verschreiben. Wir können Betrug und illegale Aktivitäten bei Finanztransaktionen bemerken. Wir können Angriffe auf ein Netzwerk in Echtzeit entdecken und abstellen. All diese Anwendungen hängen von Daten ab und sind nur möglich, weil wir jetzt Daten im ganz großem Maßstab speichern und analysieren können.

Bei dem angesprochenen Data-Management-Stack handelt es sich in der Tat um die moderne Plattform für maschinelles Lernen und Analysen. Sie lässt sich kostengünstig skalieren, um riesige Informationsmengen zu speichern und zu analysieren. Sie ist für die Cloud optimiert, sodass Unternehmen sie in ihren eigenen Rechenzentren, aber auch bei Amazon, Google oder Microsoft Azure nutzen können. Wir haben von Anfang an an die Macht der Daten geglaubt und hart an unserer Plattform gearbeitet. Heute freuen wir uns besonders über das schnelle Wachstum bei Workloads zum Internet der Dinge (IoT) oder Machine Learning. In diese Bereiche investieren wir auch weiterhin eine Menge Geld für Forschung und Entwicklung.

 

Stichwort IoT: Analysten schätzen, dass es bis 2020 um die 30 Milliarden mit dem Internet verbundene Geräte geben wird, die Unmengen an Daten produzieren. Wie kann Cloudera Unternehmen helfen, diese Daten sinnvoll zu nutzen?

Diese Daten erzählen Geschichten über das wahre Leben. Wir helfen Diabetes-Patienten mit Blutzucker-Wächtern, die über die Cloud vernetzt sind. So können sie sofort Hilfe von medizinischen Fachkräften bekommen, wenn sich ihr Blutzucker aus dem sicheren Bereich verabschiedet. Wir helfen Fuhrparkbetreibern, ihre Lkw in gutem Zustand zu halten: Vorausschauende Analysen erkennen sich abzeichnende Probleme, bevor sie passieren, sodass die Fahrzeuge sicher und günstig gewartet werden können. Für Produktionsunternehmen sammeln wir Telemetriedaten aus den Fabriken und helfen damit, Fehler im Produktionsprozess zu erkennen und die Erträge zu verbessern.

 

Hyper-vernetzte und digital transformierte Unternehmen sind auch zunehmenden Risiken ausgesetzt, etwa Cyberbedrohungen, Betrug oder Compliance-Regularien. Cloudera nimmt für sich in Anspruch, diese Risiken mit seiner Plattform abzuwehren, unterstützt durch Machine Learning und AI-Technologie. Wie funktioniert das?

Machine Learning untersucht mit Algorithmen riesige Mengen bestehender Daten. Die Algorithmen erkennen Muster in Datenbeständen, die einfach zu groß und unterschiedlich sind, als dass sie Menschen auffallen würden. Mit diesem Training sind die Algorithmen dann in der Lage, ungewöhnliches Verhalten zu erkennen, wenn es auftritt. Sie können sogar anhand einer Abfolge von Ereignissen vorhersagen, was wahrscheinlich als nächstes passieren wird. Damit können Netzbetreiber festlegen, welche Aktivitäten in einem Netzwerk »normal« sind und Cyberangriffe an unnormalen Aktivitäten erkennen. Banken können beispielsweise Datenflüsse von Kreditkartentransaktionen beobachten und die Muster ausfindig machen, die erfahrungsgemäß mit Betrug in Verbindung stehen. Diese Technik ist extrem leistungsfähig. Wir sind davon überzeugt, dass Machine Learning Entscheidungsprozesse in allen geschäftlichen Kontexten verbessern wird.

 

In diesem Jahr hat Cloudera seine Cloud-Plattform Altus sowie SDX, einen geteilten Katalog für Unternehmensdaten vorgestellt. Organisationen können damit Anwendungen einfach mit Daten verknüpfen und Daten über alle Plattformen hinweg ohne kostspielige und komplexe Infrastruktur verwenden. Bauen Sie damit an der Basis für neue Geschäftsmodelle, die sich auf Daten konzentrieren? Und erwarten Sie das Aufkommen neuer, datenorientierter Start-ups mit einer zu 100 Prozent Cloud-basierten Infrastruktur?

Diese Geschäftsmodelle und Start-ups gibt es ja schon seit Jahren! Denken Sie an Unternehmen wie Salesforce, Workday oder andere, die Services über die Cloud bereitstellen, nur mit Daten zu tun haben und diese Daten auf mächtige Art und Weise analysieren, um ihren Kunden Erkenntnisse und einen Mehrwert zu bieten. Wir wollen den Ausbau dieser Ressourcen viel einfacher machen. Jedes Start-up, jedes bestehende Unternehmen sollte in der Lage sein, große Informationsmengen zu erfassen, speichern, verarbeiten, analysieren und daraus die richtigen Schlüsse zu ziehen. Mit Altus können unsere Kunden das machen, ohne sich mit der Anschaffung von Hardware, der Konfiguration oder Installation von Software herumärgern zu müssen – sie können sich ganz auf die benötigten Ergebnisse konzentrieren.

 

Kurz vor Clouderas Börsengang in diesem Jahr haben Sie die neue Cloudera Foundation vorgestellt, deren Schwerpunkt auf Big-Data-Projekten für das Gemeinwohl liegt. Welche Ziele verfolgen Sie mit dieser Stiftung?

Die Foundation war mir ein persönliches Anliegen. Wir haben gerade mit Claudia Jüch eine großartige Geschäftsführerin an Bord geholt. Claudia ist Deutsche, lebt aber in den USA. Bevor sie zu uns kam, war sie in der Rockefeller Foundation verantwortlich für eine Reihe von Innovationsprogrammen. Mit der Foundation wollen wir unsere Software und unser Know-how Organisationen im sozialen Sektor zur Verfügung stellen, damit sie von der Analyse und dem Verständnis großer Datenmengen profitieren. Das Gesundheitswesen, um nur ein Beispiel zu nennen, wird erheblich verbessert, wenn es Patienten-, Krankheits- und klinische Daten besser versteht. Wir wollen mit Organisationen, die diese Möglichkeiten brauchen, Partnerschaften eingehen und ihnen dabei helfen, ihre eigenen Ziele effektiver zu erreichen.