Was sind eigentlich Dark Data?

So bringt man Licht ins Dunkel

Sie schlummern im Verborgenen und kaum einer im Unternehmen weiß, welche Informationen sie beinhalten. Die Sprache ist von sogenannten Dark Data, die die Verantwortlichen nicht zuletzt aufgrund von gesetzlichen Vorgaben besser aufspüren und entsprechend verwalten sollten.

Leuchtturm mit der Milchstraße im Hintergrund

Mit den entsprechenden IT-Lösungen lässt sich Licht ins Dunkel verborgener Daten bringen.

Dark Data sind Informationen im Unternehmen, deren Inhalt und Geschäftswert unbekannt sind. In den Dateien können sich also völlig belanglose Inhalte wiederfinden oder hochsensible Informationen wie Finanzdaten, Forschungsergebnisse oder personenbezogene Daten. Bei Dark Data wissen es die Unternehmen schlicht nicht. Experten schätzen, dass rund ein Drittel der lokal im eigenen Rechenzentrum und in der Cloud gehorteten Informationen aus solchen „dunklen“ Daten bestehen. Nicht nur mit Blick auf Vorschriften wie die Datenschutzgrundverordnung (DSGVO) besteht dringender Handlungsbedarf.

Entwicklungen wie die Digitalisierung und Industrie 4.0 tragen dazu bei, dass Firmen immer mehr Daten generieren. Statt diese kontinuierlich zu pflegen, erweitern Unternehmen häufig ihre Speichersysteme, um die Menge an Informationen in den Griff zu bekommen. So wächst der Datenberg unaufhaltsam und extrem rasant weiter. Studien und Analysten gehen davon aus, dass die Größe des Berges jedes Jahr um 49 Prozent zulegt.

Gefährliche Zeitbomben

Einige der gesammelten Daten bringen Unternehmen bereits heute einen hohen Nutzen. In ihnen stecken wertvolle Informationen, die mit künftigen Business-Intelligence- oder Analytics-Lösungen nutzbar gemacht werden können. Da der Inhalt der Dark Data aber im Dunkeln liegen, lässt sich nicht sagen, ob in ihnen bahnbrechende Erkenntnisse schlummern, sie risikofrei gelöscht werden könnten oder ob sie im Gegenteil sogar eine gefährliche Zeitbombe darstellen. In einigen Fällen ist nicht einmal bekannt, wo und wie viele der dunklen Daten im Unternehmen angehäuft wurden. Damit unterscheiden sie sich deutlich von den beiden anderen „Kategorien“ an Daten:

  • Unternehmenskritische Daten: Dabei handelt es sich um Daten, die für den weiteren Erfolg des Unternehmens von entscheidender Bedeutung sind. Es versteht sich von selbst, dass diese geschützt und aktiv verwaltet werden müssen.
  • Redundante, veraltete und triviale Daten (ROT – redundant, outdated, trivial information): Hierzu zählen Daten, die mehrfach auf unterschiedlichen Systemen abgelegt, veraltet oder unbedeutend sind – vom Kantinenplan bis zu den auf den Firmen-Servern abgelegten Urlaubsbildern der Mitarbeiter. Ihnen gemein ist, dass sie für das Unternehmen keinerlei Nutzen bringen. Im Idealfall fallen sie deshalb regelmäßigen Löschaktionen zum Opfer.

ROT-Daten verursachen zwar Kosten für Speicherplatz, im Vergleich zu Dark Data sind sie jedoch relativ „ungefährlich“. Denn unter Umständen entwickeln sich Dark Data für Unternehmen zu einer teuren Angelegenheit. Schließlich ist eine der Kernanforderungen der Datenschutzgrundverordnung, dass Daten auf Anfrage gelöscht werden müssen. Bei Nichteinhaltung dieser Vorschrift drohen empfindliche Strafen von bis zu vier Prozent des Gesamtumsatzes.

Unbekannten Daten auf der Spur

Das Problem: Wenn entweder nicht bekannt ist, ob überhaupt Daten vorhanden sind, oder aber niemand weiß, wo die Daten gespeichert sind, kann auch keine Löschung erfolgen. Theoretisch müsste sich die IT-Abteilung also mühsam auf die Suche nach allen personenbezogenen Daten machen. Sämtliche Ablageorte für Daten, On-Premises wie auch bei den verschiedenen Cloud-Partnern des Unternehmens, müssten einer gründlichen Inventur unterzogen werden. Eine Sisyphusarbeit, die viel Zeit und Geld kostet und wertvolle IT-Ressourcen bindet.

Die Lösungen bestehen aus IT-Ansätzen, die Dark Data gezielt ans Tageslicht bringen und dafür die Informationen, die in verschiedenen Formen vorliegen, erfassen und nach klaren Kriterien klassifizieren. Auf der Grundlage von einheitlichen Richtlinien lässt sich dann der Datenbestand mit automatisierten Tools verwalten – von der sicheren Archivierung auf verschlüsselten Servern bis hin zur Löschung.

Mit Blick auf Vorschriften wie die DSGVO können dabei Suchmuster zum Einsatz kommen, die gezielt personenbezogene Daten innerhalb des Informationsbestandes erfassen und selbstständig die jeweils passende Aktion anstoßen. Idealerweise ist die Lösung dabei auf eine Vielzahl internationaler Standards ausgerichtet, die auch globale Unternehmen befähigen, jeweils konform zu den örtlichen Vorschriften zu agieren. Darüber hinaus ist es denkbar, die Klassifizierungen mit den Aufbewahrungsfristen abzugleichen, was dafür sorgt, dass auch die ROT-Daten effizient entsorgt werden können und die IT-Systeme nicht länger belasten.

Auf der nächsthöheren Ebene einer solchen Technologie stehen Lösungen, die über Deep Learning und Methoden der Künstlichen Intelligenz (KI) sensible Daten von Unternehmen aufspüren. Mithilfe von Classification Engines werden dabei selbst petabyte-große Datenmengen nach Dark Data durchforstet. Dadurch wissen Unternehmen noch genauer, welche Daten sie besitzen, wer darauf Zugriff hat und welchen Zweck sie aktuell erfüllen.

Weil bei all diesen Schritten der Umgang der Mitarbeiter mit den Daten eine wichtige Rolle spielt, sollten entsprechende Lösungen möglichst eng in die täglichen Arbeitsabläufe integriert sein und sich durch eine gute User Experience auszeichnen. Berücksichtigen die Verantwortlichen diese Punkte im Kampf gegen Dark Data, lassen sich Herausforderungen rund um Datenschutz, Compliance und Risikomanagement wesentlich einfacher bewältigen.

* Der Autor Mathias Wenig ist Senior Technical Sales und Digital Transformation Specialist DACH bei Veritas Technologies.

Bildquelle: iStock/Getty Images Plus

©2019Alle Rechte bei MEDIENHAUS Verlag GmbH

Unsere Website verwendet Cookies, um Ihnen den bestmöglichen Service zu bieten. Durch die weitere Nutzung der Seite stimmen Sie der Verwendung zu. Weitere Infos finden Sie in unserer Datenschutzerklärung.

ok