Das Beste aus Big Data machen – aber sicher!

Das Beste aus Big Data machen – aber sicher!

Für Big Data müssen komplett neue Daten-, Kontroll- und Governance-Strukturen errichtet werden. Denn andernfalls laufen die Unternehmen Gefahr, von der Datenexplosionswelle überrollt zu werden.

Wenn mit der digitalen Revolution die Datenbestände in den Unternehmen förmlich explodieren, sind dort andere Herangehensweisen als in der jüngsten Vergangenheit gefordert. manage it hat sich mit Alfred Koch und Moritz Schneider, beide Berater bei KPMG Consulting, über die Ausgangslage sowie die notwendigen Vorkehrungen unterhalten, die Unternehmen im eigenen Geschäfts- und Data-Governance-Interesse treffen sollten.

Herr Koch, wieso hat sich die Ausgangslage für die Unternehmen mit der digitalen Revolution und Big Data komplett verändert?

Alfred Koch: Die alte Welt war durch mehr oder weniger feststehende Kommunikationswege und eine weitgehend zen-trale Datenhaltung gekennzeichnet. Diese alte Datenwelt mit klaren Grenzen zwischen intern und extern war verhältnismäßig einfach beherrschbar. Über Ansätze wie Business Intelligence (BI) und Data Governance war eine hohe Qualität bei Datenauswertungen realisierbar, parallel eine durchgehende Informationskontrolle möglich. Zumal fast alle Daten nicht nur im Unternehmen gespeichert wurden, sondern dort auch in strukturierter, indizierbarer Form vorlagen.

Das sieht mit der digitalen Revolution, Big Data und offensiv über das Internet vorangetriebenen Geschäften ganz anders aus?

Alfred Koch: Ja, die neue digitalisierte Welt ist durch verteilte, meist unstrukturierte Daten geprägt. Die Datenbestände liegen nicht nur im Unternehmen selbst, sondern auf mobilen Endgeräten, in externen Clouds oder sonst wo im Internet. Aus den vormals feststehenden Kommunikationswegen sind unzählige Kommunikationskanäle und schwer zu kontrollierende IP-Datenströme geworden. Diese weitversprengte Datenhaltung, den hohen Datenverkehr und die weitflächige Vernetzung müssen die Unternehmen dennoch beherrschen, um ihre Geschäfte vorantreiben und ihre Data-Governance-Auflagen erfüllen zu können.

Herr Schneider, Insider zeigen auf das dramatische Wachstum unstrukturierter Datenbestände, das mit den digitalen Geschäften via Internet einhergeht. Wie sollten Unternehmen diesem dramatischen Wachstum begegnen?

Moritz Schneider: Big Data birgt für die Unternehmen Chancen und Risiken zugleich. Die Flut an unstrukturierten Daten, die vornehmlich aus den Reaktionen der Kunden und potenziellen Kunden hervorgehen, sind für Unternehmen wichtige Inhalte, um ihre digitalen Geschäfte gezielt und offensiv voranzutreiben. Also besteht für sie die Herausforderung darin, die nicht formalisierten Masseninformationen, die in Form von Sprache, Texten aus E-Mails, Social Networks und Blogs, als Videos, Bilder, Sensor- und Schattendaten vorliegen,

  • schnellst möglich zu verarbeiten,
  • die Teilbestände den verantwortlichen Stelle zuzuweisen,
  • um sie dort auszuwerten und zu analysieren.

Aus den Analyseergebnissen können dann lokal gegenüber den Kunden und potenziellen Kunden konkrete Antworten und Handlungsempfehlungen abgeleitet werden. Demzufolge sind für Big Data die Begriffe Datenvielfalt (Variety), Menge (Volume), Geschwindigkeit (Velocity) und Analyse (Analytics) geprägt worden.

… und die Risiken, die Big Data für Unternehmen in sich bergen?

Moritz Schneider: Die Nutzung unstrukturierter Daten ist ohne neue Technologien stark eingeschränkt. Weil nicht formalisiert, liegen für sie oftmals weder Datenmodelle noch Metadaten vor. In vielen Textdokumenten sind strukturierte Daten mit unstrukturierten Daten vermischt. Unstrukturierte Daten sind meist nicht indizierbar. Sie können mit traditionellen Tools nicht automatisch durchsucht, analysiert und ausgewertet werden. Unstrukturierte Daten können außerdem für das Unternehmen mit Blick auf Data Governance Sicherheits- und rechtliche Probleme nach sich ziehen, nämlich dann, wenn sie beliebig erfasst und gespeichert werden. Solche Risiken sind beherrschbar, indem diese Daten mittels Datenmodellen formalisiert werden. Unstrukturierte Daten erhalten erst Struktur, wenn sie durch menschliche Intervention in ein Schema gebracht werden.

Herr Koch, heißt das nicht, wenn Unternehmen mit Big Data ihre geschäftlichen Chancen wahren wollen, müssen sie dafür die Risiken in Kauf nehmen?

Alfred Koch: Nein, die Kunst besteht darin, das Eine zu tun, ohne das Andere zu lassen. Das Eine ist, als Unternehmen das Potenzial von Big Data voll auszuschöpfen. Dazu sollte für Big-Data-Analysen ein neuer Ansatz zur Erfassung, Speicherung und Analyse der Daten verfolgt werden. Speziell für die Analyse unstrukturierter Daten stellt der Markt bereits Werkzeuge wie Textanalyse und Textmining, maschinelles Lernen auf Basis statistischer Verfahren, neuronale Netze, Latente Semantische Analyse (LSA) sowie linguistische Verfahren zur Verfügung. Auf diese Weise erhalten Unternehmen im gewaltigen Fluss digitaler Informationen tiefe Einblicke in das Verhalten von Kunden, Partnern und anderen Unternehmen, um daraus für ihre digitalen Geschäfte Wettbewerbsvorteile zu ziehen. Die Verantwortlichen können schnell Entscheidungen treffen, neue Trends ausmachen und bei Bedarf ad hoc Kurskorrekturen einleiten. Allerdings setzen die neuen Methoden, Algorithmen und Visualisierungen im Unternehmen neue Kompetenzen wie die eines Data Engineers voraus. Er wird auch dazu gebraucht, um für komplexe digitale Abläufe aussagekräftige Auswertungen zu modellieren.

A propos »ohne das Andere zu lassen«: Wie können Unternehmen die mit unstrukturierten und zudem stark anwachsenden Datenbeständen einhergehenden Risiken ausschließen oder zumindest minimieren?

Alfred Koch: Angesichts der Risiken müssen bestehende Ansätze für BI und Data Governance neu überdacht und definiert werden. Beide Ansätze müssen im Zeitalter der digitalen Revolution einerseits über die Grenzen der eigenen Organisation hinaus wirken, um die verteilten Informationen steuern zu können. Andererseits muss in die für BI und Data Governance relevanten Informationen Struktur gebracht werden, um sie beispielsweise in bestehende Drei-Layer-Data-Warehouses aufnehmen zu können.

Moritz Schneider: Man könnte dazu ein Data–Warehouse auf Apache-hadoop-Basis für die verteilte Verarbeitung und Analyse unstrukturierter Daten realisieren. Die innerhalb dieses Frameworks hinterlegten Daten können mittels einer Unstructured In-
formation Management Architecture (UIMA), genauer gesagt über zu erstellende Anwendungen mit den Verarbeitungsregeln, mit den notwendigen Strukturen für die Aufnahme ins Data-Warehouse versehen werden.

Für Data Governance, also die Sicherheit von Daten und die Gewissheit, dass Daten regelkonform behandelt werden, wird mehr als nur die Strukturierung relevanter Daten notwendig sein. Welche Sicherheitsvorkehrungen sollten Unternehmen für ihren digitalen Geschäftsauftritt ins Kalkül ziehen?

Alfred Koch: Junge und branchenfremde Unternehmen dringen in den eigenen, angestammten Marktsektor ein und verändern ihn mit ihren Angeboten. Hinzu kommen die Risiken, im -Cyberspace von anderen Unternehmen, von Wirtschaftskriminellen oder Geheimdiensten ausgespäht zu werden. Angesichts dieser Bedrohungen sollten zur Absicherung der digitalen Geschäfte unbedingt angemessene Schutzbar-rieren aufgestellt werden.

Das beginnt mit der Entscheidung, wo unstrukturierte Daten gespeichert und wie sie verwaltet werden sollen. Im Cyberspace, verstärkt durch den Trend »mobile first«, wird de facto von überall auf Anwendungen und Daten zugegriffen. Deshalb sollte im Unternehmen das Identity and Access Management an diese neuen Herausforderungen angepasst werden. Mit einem intelligenten Zugriffskontrollnetz lassen sich auch Daten in der Cloud und bei einer Maschine-zu-Maschine-Kommunikation schützen. Darüber hinaus werden die Unternehmen zur Absicherung ihrer digitalen Geschäfte zunehmend starke Datenverschlüsselungsverfahren aus vertrauenswürdiger Bezugsquelle einsetzen müssen.


Das Interview führte Hadi Stiel, freier Journalist und Kommunikationsberater in Bad Camberg.

 

Titelbild: Shutterstock.com/vs148