Daten demokratisieren = Kontrollverlust? 4 Gründe, die dagegensprechen

Illustration: Absmeier, TBIT

Die Demokratisierung von Daten ist in vielen Unternehmen ein erklärtes Ziel – jeder Mitarbeiter soll eigenständig Daten für seine geschäftlichen Zwecke nutzen und analysieren können. Möglich wird dies beispielsweise durch eine moderne Data Fabric basierend auf Datenvirtualisierung. Doch wenn Datensätze für jeden frei verfügbar sind, droht Unternehmen dann nicht, dass sie die Kontrolle über diese verlieren? Nicht unbedingt, meint Otto Neuer, Regional VP and General Manager bei Denodo, und erklärt, wie Unternehmen diesem vermeintlichen Kontrollverlust bei der Datenvirtualisierung begegnen können.

 

  1. Kontrolle mittels Role Based Access

Die Prämisse von Datendemokratisierung – jeder Mitarbeiter ist in der Lage, Daten selbstständig zu sammeln, zu analysieren und zu nutzen – hört sich zunächst überzeugend an. Schließlich können Unternehmen so beispielsweise Prozesse beschleunigen, weil Mitarbeiter nicht mehr zunächst auf aufbereitete Datensätze warten müssen. Gleichzeitig gibt es aber in jedem Unternehmen Daten, die schlicht nicht für jeden einsehbar sein sollten – Personal- oder Finanzdaten etwa. Auch brauchen Mitarbeiter in höheren Positionen wahrscheinlich Zugang zu anderen Daten als ihre Teammitglieder.

Mit einer Plattform für Datenvirtualisierung können Unternehmen entsprechende Role Based Access Controls (RBAC) in einer zentralen Schicht einrichten. Das heißt, sie können genau festlegen, welche Rollen auf welche Daten zugreifen dürfen. Dies lässt sich je nach Lösung sogar granular für einzelne Spalten oder Zeilen in Datenbanken bestimmen. Unternehmen können so sicherstellen, dass Mitarbeiter nur auf die Daten zugreifen, die ihrer Rolle und ihrem Level entsprechen.

 

  1. Kontrolle darüber, wie Daten genutzt werden

Es geht aber nicht nur darum, auf welche Datensätze Mitarbeiter Zugriff erhalten, sondern auch, was sie anschließend mit diesen machen können. Denn Unternehmen sind verpflichtet, den Missbrauch ihrer Daten zu verhindern. Daher ist ein Monitoring wichtig, um die Übersicht darüber zu haben, wer welche Daten wann und wie nutzt oder verändert. Eine Datenvirtualisierungs-Plattform geht dabei noch einen Schritt weiter: Sie ist in der Lage, Nutzern Datensätze zu empfehlen, die für ihre Zwecke am besten geeignet sind. Außerdem sorgt die semantische Schicht bei der Datenvirtualisierung dafür, dass alle Datensätze einer gemeinsamen Taxonomie und Namenspraxis folgen, und stellt Mitarbeitern diese standardisierten virtuellen Datensätze bereit. Dadurch wird verhindert, dass unterschiedliche Datendefinitionen zu Verwirrung oder gar Chaos führen.

 

  1. Kontrolle über die Auslastung der Backend-Systeme

Wenn alle Mitarbeiter die Unternehmensdaten nach Belieben verwenden können, kann dies zu einer starken Auslastung oder Überlastung der Backend-Systeme (z.B. ERP) führen. Um dies zu verhindern, bietet eine Plattform für Datenvirtualisierung aber verschiedene Möglichkeiten: So lassen sich die Auswirkungen mithilfe eines Resource Managers kontrollieren, indem hier konkrete Einschränkungen für Abfragen definiert werden. Unternehmen können beispielsweise begrenzen, wie viele Querys gleichzeitig durchgeführt werden können, wie lange die Abfrage dauern darf, bevor sie automatisch beendet wird, wie viele Zeilen das Ergebnis haben darf und mehr. Gleichzeitig können Unternehmen auch vorgeben, wann diese Restriktionen greifen. Dies kann zum Beispiel bei bestimmten Rollen der Fall sein, aber etwa auch bei der Zugriffsmethode.

 

  1. Kontrolle darüber, wie Daten abgefragt werden

Unternehmen können mithilfe von einer Datenvirtualisierungs-Plattform aber nicht nur einschränken, wie Querys sich auf die Backend-Systeme auswirken, sondern auch, wie Mitarbeiter diese grundsätzlich durchführen können. Dafür stehen ihnen Filter zur Verfügung, die den abgefragten Bereich einschränken. So werden Mitarbeiter davon abgehalten, (womöglich unbedacht) den gesamten Datenbestand des Unternehmens durchzusuchen, was bei Tausenden Terabyte an Daten sehr viel Zeit und auch Geld kostet. Unternehmen können es ihren Mitarbeitern freistellen, diese Filtermöglichkeiten zu nutzen, oder aber die Plattform so konfigurieren, dass sie verwendet werden müssen. Da bei der Datendemokratisierung auch viele Mitarbeiter ohne technisches Verständnis für etwaige Auswirkungen Querys durchführen, kann dies eine probate Lösung sein, um einerseits den Zugang zu Daten zu gewähren, aber ohne andererseits fürchten zu müssen, dass die Systeme überlastet werden und die Kosten explodieren.