In zehn Jahren wird man über das was wir heute unter Big Data verstehen nur müde lächeln. Die Datenmengen werden durch das »Allesnetz« in einem unvorstellbaren Ausmaß wachsen. Es gilt den Herausforderungen schon heute zu begegnen.

Angetrieben von immer neuen technischen Innovationen, bieten sich in der heutigen Zeit mehr Möglichkeiten denn je Daten zu sammeln und zu analysieren. Trotzdem sind diese vermeintlich neuen Daten nicht einfach aus dem nichts entstanden, sondern sie existierten schon immer – nur dass es keine Möglichkeiten gab diese zu messen und zu verarbeiten.

Als Metapher kann man sich ein Schiff auf See vorstellen, das ununterbrochen von Dateninformationen (wie Wetter, Treibstoffreserven und Beladung) abhängig ist. Vor nicht allzu langer Zeit wäre der Kapitän dieses Schiffes froh gewesen, hätte er nur jeden Tag die genaue Position ermitteln und in sein Logbuch eintragen können. Heutzutage sind moderne Schiffe aber nicht nur in der Lage die Position jederzeit zu ermitteln, sondern anhand von Wetterkarten, Radarinformationen, Echolot u.v.m. Entscheidungen zu treffen, die für einen sicheren Seegang von Nöten sind. Daran zeigt sich, dass diejenigen, welche einen Vorsprung an Wissen haben, stets einen Vorteil gegenüber ihren Konkurrenten oder Mitbewerbern besitzen. Deshalb trifft das Zitat von Peter Sondergaard (2011), die Wichtigkeit von Daten und Informationen in der heutigen Zeit:

»Information is the oil of the 21 century and analytics is the combustion enginge«. [1]

Durch das exponentielle Wachstum von Datenmengen werden IT-Experten nun vor neue Herausforderungen gestellt. In Deutschland wird Big Data oft als Sammelbegriff für die moderne digitale Technologie verwendet. Aber nicht nur die digitalen Datenmengen an sich stehen im Fokus. Vielmehr nimmt Big Data und die damit einhergehende Digitalisierung auch nachhaltig Einfluss auf die Sammlung, Nutzung, Verwertung, Vermarktung sowie vor allem Analyse der digitalen Daten. Im Kontext von Big Data stehen auch zwangsläufig die drei grundlegenden Kriterien: Volume, Velocity und Variety. Das Big Data etwas mit großen Datenmengen zu tun hat, darauf wäre man wohl auch ohne die drei »Vs« gekommen. Das heißt, falls eines dieser Kriterien zutrifft, hätte man ein gutes Argument für ein Big-Data-Projekt.

Volume ist die Problematik der Speicherung von riesigen Datenmengen, deren Aufkommen so groß und komplex ist, dass es mit herkömmlichen Methoden der Datenverarbeitung nicht mehr gespeichert oder gar analysiert werden kann.

Velocity dagegen bezeichnet die Geschwindigkeit, mit der Daten generiert und verarbeitet werden können, sodass, wenn man es auf die Spitze treibt, eine Echtzeitverarbeitung und -analyse erzielt werden kann.

Variety bezieht sich auf die Vielfalt der Datentypen und -quellen. Neben herkömmlichen Datensätzen zählen auch Texte, Bilder, Videos, Geodaten oder Audioaufzeichnungen zu dieser Datenvielfalt. Diese müssen gesammelt, strukturiert und auf Zusammenhänge untersucht werden, um sie anschließend in Beziehung zueinander zu setzen.

Grundvoraussetzung für Big Data sind die Entwicklung neuer Technologien der Datenverarbeitung, wie beispielsweise In-Memory-Speicherlösungen, oder das Voranbringen neuer Algorithmen und Werkzeuge, wie Business-Intelligence-Tools.

Potenziale und Risiken. In Unternehmen fallen täglich Unmengen an Informationen und Daten an. Mithilfe von Big Data und Big Data Analytics können Daten aufbereitet und in Informationen umgewandelt werden. Aus diesen lassen sich zum einen neue Kennzahlen entwickeln, aus welchen schlussendlich Geschäftsentscheidungen getroffen werden, die zum Erfolg des Unternehmens führen. Durch Echtzeitanalysen kann diese Entscheidungsfindung zusätzlich schneller stattfinden und man kann auf sich ändernde Daten reagieren. Weiterhin kann Big Data dazu beitragen präventiv Entscheidungen zu treffen, und dadurch einen Vorteil gegenüber den Wettbewerbern zu erzielen. Beispielsweise durch die Auswertung von Maschinendaten können Informationen erhalten werden, in welchen Abständen die Maschine ausfällt. Durch den Einsatz zusätzlicher Sensorik können weitere Daten erfasst werden, um daraus Abhängigkeiten und Zusammenhänge zu ermitteln. Durch die gewonnenen Informationen lassen sich Maßnahmen, etwa eine Instandhaltung zu einem bestimmten Zeitpunkt vor Ausfall der Maschine, einrichten. Dadurch lassen sich nicht nur Prozesse optimieren, sondern auch Kosten senken.

Einer der größten Chancen von Big Data sind vor allem neue Einblicke in Kundenbedürfnisse und in das Kaufverhalten von Kunden zu bekommen. Durch die Analyse dieser Daten können vorhandene oder kommende Trends erkannt beziehungsweise vorausgesagt werden. Firmen können nun darauf reagieren und neue Produkte oder besondere Marketingstrategien entwickeln. Für Unternehmen im B2C-Bereich ist die Entwicklung der sozialen Netzwerke ein Segen. Niemals zuvor konnte man eine so breite Masse an personenbezogenen Daten aus Tweets, Likes, Hashtags, Trends und Diskussionen sammeln.

Wo Big Data auf der einen Seite viele reizvolle Vorteile bietet, muss man an dieser Stelle auch einmal auf die Kehrseite eingehen. Der zu weiten Teilen meist kritisierte Punkt an Big Data ist der Eingriff in die Privatsphäre der Menschen. Diejenigen Unternehmen, welche die Daten der Menschen nutzen und analysieren, können tiefe Einblicke über die Gewohnheiten und charakterlichen Züge des Menschen gewinnen. Während im Internet unaufhaltsam eine Spur von Daten erzeugt wird, werden Bewegungen im Netz von sogenannten Cookies aufgezeichnet. Seiten, die besucht, Produkte, welche angeschaut werden oder auch in welcher Reihenfolge, wird hier gespeichert. Am Ende dieser Spur steht der Endverbraucher. Durch die Entschlüsselung und Analyse dieser Spuren werden Verbtaucher zu gläsernen Objekten, woraus deren Gewohnheiten, politische Einstellungen, Hobbys, Gesundheitszustand und vieles Weiteres gefolgert werden kann – dadurch geht jede Art von Anonymität verloren. Wo auch immer Daten gesammelt werden, besteht das Risiko, dass diese Daten in fremde Hände gelangen und Schaden verursachen. Deshalb spielt das Thema Datenschutz eine entscheidende Rolle bei der Diskussion um Big Data.

Die Zukunft. Ganz egal wie groß das Volumen von Daten im Moment auch ist, der Trend wird sich fortsetzen und in den kommenden Jahren weiter zunehmen. Unter dem Begriff »Internet of Things (IoT)« oder auch »Allesnetz« genannt, wird die vollständige Vernetzung von wirklich allem möglich: Angefangen von der gechipten Kuh, vollautomatische Produktionsstraßen, Telekommunikationsdaten, Verkehrsampeln, bis hin zu Smart-Home-Systemen, die schon vorher wissen, wann man zu Hause sein wird, um bei der Ankunft die gewünschte Zimmertemperatur vorzufinden. Sieht man für einen Moment von der Diskussion über Datensicherheit und Kontrolle ab und betrachtet nur den technischen Aspekt, so ist jetzt schon klar: Es wird eine unvorstellbare Menge an Daten anfallen. Wir verfügen im Moment nicht einmal über die passenden Vergleichsmaßstäbe, um die Datenmenge, über die wir verfügen werden, zu bemessen. Entsprechend drängend sind die Fragen nach der Entwicklung der Rechenleistung und der Speichermedien. Die eigentliche Ära von Big Data steht uns also erst noch bevor.

