Datenintegrität: Gute Daten, schlechte Daten

Illustration: Comfreak, Absmeier


So kann Automatisierung dabei helfen, die Integrität von Daten im Zeitalter von Big Data zu gewährleisten.

Der Begriff Big Data ist nun schon einige Jahre alt. Er wurde Mitte der 2000er Jahre erfunden, um Datensätze zu beschreiben, die zu groß waren, um sie mit herkömmlichen Business-Intelligence-Tools verwalten und verarbeiten zu können. Seitdem ist die Menge der Daten bekanntlich exponentiell weiter gewachsen und stellt IT-Manager allein schon wegen des schwer vorstellbaren Volumens vor große Herausforderungen.

Doch über die enorme Menge der Daten hinaus, gibt es selbstverständlich noch weitere Facetten, die es bei Big Data zu beachten gilt. Eine dieser Facetten ist die Art neu generierter Daten, die zu einem immer größer werdenden Anteil unstrukturiert sind. Der Nachteil bei der Verwaltung solcher Daten ist, dass sie im Vergleich zu ihren strukturierten Verwandten deutlich schwerer zu kategorisieren und zu sortieren sind. Die Datenspeicherung und -verwaltung ist natürlich kein Selbstzweck. In den vielen Daten schlummert enormes Potenzial, das Unternehmen mit Big-Data-Analytics-Lösungen nutzen wollen, um im Wettbewerb mit anderen Unternehmen erfolgreich zu sein. Somit ist es für jedes Unternehmen sehr wichtig zu lernen, wie sie mit den immer größer werdenden, vermehrt unstrukturierten Datensätzen umgehen sollen.

 

Mangelnde Datenintegrität verfälscht Big-Data-Analysen
Die Suche nach Wert innerhalb der Daten ist für viele IT-Verantwortlichen, trotz der Nutzung entsprechender Lösungen, wie die sprichwörtliche Suche nach der Nadel im Heuhaufen. Doch nicht nur das große Datenvolumen stellt bei dieser Suche nach wertvollen Informationen ein enormes Problem dar. Denn je mehr Informationen man hat, desto größer ist die Wahrscheinlichkeit, dass einige dieser Informationen falsch, doppelt, veraltet oder anderweitig fehlerhaft sind. Diese mangelhafte Integrität gespeicherter Daten stellt für Unternehmen natürlich eine große Herausforderung dar. Denn sind Daten verfälscht, können die aus ihnen abgeleiteten Erkenntnisse auch nicht richtig sein.

Sieht man sich die Probleme vieler Unternehmen mit ihren Ansätzen zur Datenanalyse in der Praxis an, so erkennt man, dass diese Lösungen alleine nicht ausreichen, um Datenintegrität bei großen Datensammlungen zu gewährleisten. Neue Technologien wie KI und maschinelles Lernen können zwar helfen, auch sehr große Datensätze besser zu verstehen, doch auch ihre Ergebnisse können nur so gut sein, wie die zugrunde liegenden Daten. Damit die Gewinnung von Erkenntnissen im Rahmen einer Big-Data-Strategie also effektiv ist, egal ob mit traditionellen Mitteln oder neueren Mitteln wie KI, muss ein gewisses Maß an Ordnung herrschen. Daten müssen also von fehlerhaften, doppelten oder alten Versionen befreit werden, bevor sie für die Analyse genutzt werden können. Nur so ist die Analyse effektiv und lässt sich zukünftig höher skalieren.

 

Konfigurationsfehler produzieren einen Strom fehlerhafter Daten
Fehler zu finden und zu beseitigen ist somit eine wertvolle Fähigkeit. Dies gilt generell für alle Fehler, insbesondere jedoch für grundlegende Konfigurationsfehler von Datenquellen. Bleiben diese Fehler unentdeckt, so produzieren diese Quellen einen andauernden Strom schlechter Daten – und schlussendlich natürlich auch eine uneffektive Analyse und fehlerhafte Ableitungen. Der Wert solcher Big-Data-Analysen ist natürlich gering.
Dieses Problem wird noch verschärft, wenn Daten aus mehreren verschiedenen Quellen und Systemen aufgenommen werden, von denen jede die Daten unterschiedlich verarbeitet haben kann. Die schiere Komplexität einer solchen Big-Data-Architektur kann das Aufspüren von Fehlern fast unmöglich machen. Man sucht dann nicht mehr nach einer Nadel im Heuhaufen, sondern eine Nadel in einem Stall voller Heuhaufen.

 

DSGVO fordert höhere Datenintegrität von Unternehmen
Inzwischen ist die Herausforderung Datenintegrität zu schaffen nicht mehr nur auf die IT-Abteilung beschränkt. Seitdem die DSGVO in Kraft ist, müssen Unternehmen Wege finden, ihre personenbezogenen Daten im Rahmen der Gesetzgebung zu verwalten – unabhängig davon, wie komplex ihre Infrastruktur sein mag, oder wie schwierig es sein kann, unstrukturierte Daten zu verwalten. Darüber hinaus müssen Unternehmen in der Lage sein, Informationen über eine Person zu löschen, zu sammeln und sogar an Behörden weiterzugeben.

 

Die Automatisierung des Data-Warehouse schafft Datenintegrität
Also, was ist die Lösung? Eine der besten Lösungen für die Verwaltung des Monsters »Big Data« und eine, die die Möglichkeit bietet, Datenintegrität zu schaffen, ist die komplette Automatisierung des Data-Warehouse. Automatisiert man dieses, schafft man einen klaren Weg, der zeigt, woher die Daten stammen und wie sie im Lauf der Zeit verwendet wurden.
Darüber hinaus sind automatisierte Prozesse wesentlich einfacher zu verwalten und damit auch zuverlässiger. Um ihre Datenaufnahme und -verarbeitung zu automatisieren, nutzen Unternehmen eine moderne Automatisierungssoftware. Moderne Lösungen bieten über die effektive Automatisierung auch Funktionen, die die Abstammung von Daten bis ins kleinste Detail darstellen können. Sie können Datenquellen beispielsweise sogar nachträglich katalogisieren. Auch die Datenextraktion zur Einhaltung von Anforderungen im Rahmen der DSGVO ist mit solchen Lösungen einfach möglich.

Mit den richtigen Tools, wie der Automatisierung des Data-Warehouse, wird die Datenspeicherung im Rahmen einer Big-Data-Strategie wesentlich einfacher – und schafft gleichzeitig Datenintegrität. So können Datenprozesse einfach zurückverfolgt werden, inklusive wann und wo die Daten genutzt wurden. Big Data kann so mit all seinen komplexen Facetten gelingen und Erkenntnisse liefern, auf die sich Unternehmen auch komplett verlassen können.

Rob Mellor, VP und GM EMEA WhereScape

 

 

Was ist Datenintegrität?
Die Datenintegrität umfasst Maßnahmen, damit geschützte Daten während der Verarbeitung oder Übertragung nicht durch unautorisierte Personen entfernt oder verändert werden können. Sie stellt die Konsistenz, die Richtigkeit und Vertrauenswürdigkeit der Daten während deren gesamten Lebensdauer sicher und sorgt dafür, dass die relevanten Daten eines Datenstroms rekonstruierbar sind.

Die Datenintegrität bildet in Kombination mit dem Datenschutz und der Datensicherung die Eckpfeiler einer verlässlichen Informationsverarbeitung.

 

35 Artikel zu „Datenintegrität“

Cybersicherheit 2018 – Unternehmen müssen Datenintegrität besser verstehen

Das neue Jahr begann durch das Bekanntwerden der Sicherheitslücken »Meltdown« und »Spectre« mit einem weiteren Tiefschlag für die Cybersicherheit. Auch aufgrund der zunehmenden Vernetzung müssen nach Meinung von Palo Alto Networks in 2018 weitere Cyberangriffe eingeplant werden. Alle Unternehmen sollten daher ein hohes Maß an »Cyberhygiene« realisieren, indem sie regelmäßig ihre Daten sichern, ihre Systeme…

2017: Das Jahr der Angriffe auf die Datenintegrität

Angriffe auf die Integrität von Unternehmensdaten nehmen zu. Längst geht es Cyberkriminellen nicht mehr nur um Datendiebstahl. Vielmehr gilt es künftig, eine Manipulation der Informationen zu verhindern: Die Datenintegrität spielt im Jahr 2017 eine entscheidende Rolle in der IT-Sicherheit von Organisationen. 2013: Eine Hacker-Gruppe hatte sich in den Twitter-Account von Associated Press eingeloggt und die…

IoT-Geräte stellen Sicherheitsrisiken durch Cyberangriffe dar

IoT entwickelt sich immer mehr zum Haupttreiber für PKI, gleichzeitig sind Unternehmen nicht ausreichend auf Bedrohungen vorbereitet. Das IoT (Internet of Things) ist aktuell einer der Technologietrends mit dem stärksten Wachstum. Unternehmen setzen sich jedoch gefährlichen Cyberrisiken aus, indem sie in diesem Zusammenhang der PKI-Sicherheit nicht genügend Priorität beimessen. Das zeigen die neuesten Untersuchungsergebnisse von…

IT-Profis unterschätzen Endpoint Security häufig 

Kritische Geräte wie PCs und Drucker sind weiterhin eine Sicherheitslücke. Nur bei einem von drei Unternehmen ist Endpoint Security ein zentraler Bestandteil der eigenen Cyber-Security-Strategie. Gerade einmal 28 Prozent der Unternehmen decken Sicherheit in ihren Anforderungskatalogen ab. Bei fast der Hälfte aller Unternehmen sind Drucker nicht Teil der Endpoint Security – für 62 Prozent bieten…

Mangelhafter Sicherheitsansatz – nur ein Viertel der Führungskräfte sind von ihrer Cybersicherheit überzeugt

Deutsche Unternehmen bekämpfen Sicherheitsbedrohungen im digitalen Zeitalter mit alten Tools. Schlechte Zeiten für die Sicherheit: Laut einer neuen Studie, die von VMware beauftragt und von Forbes Insights durchgeführt wurde, sind nur 25 % der Führungskräfte in Europa von ihrer aktuellen Cybersicherheit überzeugt [1]. Drei Viertel (76 %) der Führungskräfte und IT-Sicherheitsexperten aus der Region glauben,…

Security-by-Design – Direkt in Chips eingebettete Geräteidentitäten speziell für IoT-Anwendungen

Security-by-Design, also Sicherheit schon in der Entwicklungsphase zu berücksichtigen, ist kein neues Konzept. Dabei werden Sicherheitsüberlegungen und bewährte Verfahren so früh wie möglich im Entwicklungsprozess eines IoT-Produkts, einer Anwendung oder einer Netzwerkentwicklung bedacht um Schwachstellen zu vermeiden. Mit diesem Konzept werden Geräteidentitäten erstellt und die Datenintegrität ebenso geschützt wie die Kommunikationsprozesse. So arbeiten IoT-Nutzer, seien…

Einfach intelligenter produzieren: Was eine Plattform für die Industrie 4.0 können muss

Megatrend »Plattformisierung in der Cloud« ergreift auch das industrielle Internet der Dinge (IIoT). Vom geschlossenen IT-Silo zum flexibel erweiterbaren IT-Fertighaus für die Smart Factory.   Seit dem Jahrtausendwechsel erleben wir einen atemberaubenden Siegeszug: Im sogenannten Internet of Things (IoT) werden Dinge zu Daten, alles wird Algorithmus. Einer der Megatrends in dieser digitalen Revolution: die »Plattformisierung«…

Prozesse optimieren in 10 Schritten: So finden Sie das passende ERP-System

Es gibt für ein Unternehmen eine Vielzahl von Gründen sich ein Enterprise-Ressource-Planning-System (ERP) zuzulegen. Oft geschieht dies im Rahmen eines natürlichen Wachstumsprozesses, bei dem man feststellt, dass das aktuelle ERP-System nicht mehr den zukünftigen Anforderungen entspricht. Der Erfolg, die Entwicklung oder Expansion eines Unternehmens kann neue Anforderungen und Strukturen mit sich bringen. In solchen Fällen…

Health-Check: Wie fit ist Ihr Data Warehouse?

In vielen Unternehmen ist das Data Warehouse in die Jahre gekommen. Gleichzeitig wachsen die Anforderungen der Fachabteilungen. Mit IoT und der Digitalisierung kommen zudem neue Herausforderungen hinzu. Ist Ihr Data Warehouse all dem noch gewachsen? Machen Sie den Health-Check. Das Data Warehouse (DWH) bildet das Fundament für Business Intelligence und Data-Analytics-Plattformen. Es dient als zentraler…

Fast die Hälfte aller Unternehmen werden Opfer von Cyberangriffen auf Geschäftsprozesse

  Eine aktuelle Umfrage offenbart eine beunruhigend hohe Zahl von BPC-Angriffen auf Unternehmen in Deutschland und weltweit. Dabei geht die größte Gefahr insbesondere von Angriffen per E-Mail aus, die gerade in finanzieller Hinsicht verheerende Folgen nach sich ziehen können. Trotz zunehmender Angriffe ist knapp die Hälfte des Managements nicht ausreichend über das Thema Business Process…

IoT: Fortschritte auf dem Weg zum vernetzten Unternehmen

Laut Intelligent Enterprise Index ist der Fortschritt beim Einsatz von IoT-Lösungen durchaus beachtlich: Die Zahl der vollständig vernetzten Unternehmen hat sich 2018 im Vergleich zum Vorjahr auf 11 Prozent verdoppelt. Zebra Technologies stellte Ende Oktober die Ergebnisse seines zweiten jährlichen »Intelligent Enterprise Index« vor, einer Studie, die aufzeigt, welchen Fortschritt Unternehmen auf dem Weg zum…

IIoT: Mit Vernetzung und Prozessexzellenz zur intelligenten Fabrik

Handlungsempfehlungen, wie sich smarte Servicekonzepte speziell für das industrielle Umfeld realisieren lassen. Industriebetriebe stellen komplett andere Anforderungen an vernetzte Prozesse und die dafür eingesetzte Hardware als Verbraucher. Deshalb ist das Industrial Internet of Things (IIoT) als Konzept entwickelt worden, das die Konnektivität für intelligente Fabriken, Maschinen und Management-Systeme in den Fokus rückt. Das wirkt sich…

IoT-Plattformen sind Realität in europäischen Unternehmen

»IoT-Plattformen sind in acht von zehn Unternehmen Thema«. Das hat eine repräsentative Befragung von 553 Industrieunternehmen ab 100 Mitarbeitern im Auftrag des Digitalverbands Bitkom ergeben. Demnach setzen 27 Prozent auf die IoT-Plattform eines externen Providers, kurz: Plattform as a Service – PaaS, 16 Prozent nutzen eine selbst programmierte IoT-Plattform. Weitere 18 Prozent der Unternehmen planen…

IoT-Plattformen sind in acht von zehn Unternehmen Thema

■  Vier von zehn Unternehmen nutzen bereits IoT-Plattformen. ■  Weitere 18 Prozent planen den Einsatz einer IoT-Plattform. ■  Bedenken wegen Datensicherheit und Kosten.   IoT-Plattformen sind für die Industrie 4.0 von zentraler Bedeutung. Sie ermöglichen die Vernetzung und Interaktion verschiedenster Maschinen, Geräte und Anwendungen im Internet der Dinge. IoT-Plattformen sind damit technischer und betriebswirtschaftlicher Basis…

Gesundheitsausgaben steigen weiter

Steigende Lebenserwartung, zunehmende Zivilisationskrankheiten sowie erhöhter Kosten- und Regulierungsdruck: Das Gesundheitswesen muss smarter werden, um den aktuellen und künftigen Anforderungen zu genügen. Neue Technologien rund um Smart Health sollen Kosten senken und Effizienz steigern. Technologien spielen für das Gesundheitswesen ebenso eine zentrale Rolle wie neue Ansätze und operative Modelle. Ob Talentgewinnung, Wertschöpfung oder die Ansprüche…