Dark Data

Nur ein paar Prozent aller Daten werden genutzt

Das weltweite Datenvolumen ist in der Größenordnung einer eins mit 21 Nullen angekommen. Doch genutzt wird davon nur ein Bruchteil.

Dr. Iris Lorscheid

Prof. Dr. Iris Lorscheid, Professorin für Digital Business & Data Science an der University of Applied Sciences Europe in Hamburg

Die Menge der weltweit verfügbaren Daten steigt langsam ins Unermessliche. Doch nur ein Bruchteil davon wird verarbeitet, der Rest ist Dark Data, das große Unbekannte in den Daten. Warum das so ist und welche Probleme für Unternehmen daraus entstehen können, erklärt Prof. Dr. Iris Lorscheid, Professorin für Digital Business & Data Science an der University of Applied Sciences Europe in Hamburg in einem Interview.

Frau Dr. Lorscheid, was ist mit dem Begriff Dark Data genau gemeint?
Der Begriff „Dark Data“ - oder „schlafende“ Daten - bedeutet, dass wir deutlich mehr Daten erheben als wir analysieren. Welchen Zweck sie einmal erfüllen könnten, ist uns dem Namen entsprechend noch nicht bewusst. Gesammelt werden sie trotzdem: Wir sind mit unseren gespeicherten Daten weit oberhalb der Milliarde im Zettabyte-Universum ankommen, das sind 1021, also 21 Nullen hinter der Eins. Um es anschaulich zu machen: Dies ist die Größenordnung aller Sandkörner an den Stränden unserer Welt oder alle bisher gesprochenen Worte der Menschheit – unfassbar große Datenmengen.

Wie groß ist denn der Anteil der Daten, die nicht mehr analysiert werden können?
Laut einer Studie von IBM waren bereits im Jahr 2015 über 80 Prozent aller Daten ungenutzt und sollten bis 2020 auf 93 Prozent steigen. Das sind enorme Massen an Informationen, beispielsweise von Algorithmen im Internet und „smarten“ Geräten in unserem Alltagsgebrauch gesammelt werden - Quellen sind etwa unsere Bewegungen im Internet, Aktivitäten in Sozialen Medien, Daten aus unserer Smartphone-Nutzung und zunehmend auch das Internet of Things. Dort werden von den Unternehmen sogar nur weniger als ein Prozent der Daten untersucht, mehr als 99 Prozent der gesammelten Daten gehen verloren, bevor sie die Entscheidungsträger überhaupt erreichen.

Das sind enorme Zahlen. Aber warum erheben die Unternehmen überhaupt so viele scheinbar unnötige Daten?
Weil sie es können. Niemand möchte die vielbesagte digitale Transformation verschlafen. So erheben Unternehmen oft prophylaktisch Daten. Für deren Nutzung gibt es aber häufig nur vage Vorstellungen, Schlagworte und einzelne Projektideen, die in keinem Verhältnis zum Datenvolumen stehen. Doch wer kann schon absehen wofür die Daten einmal wertvoll sein könnten? Dunkle Daten sind Daten, dessen Nützlichkeit wir noch gar nicht kennen oder noch nicht richtig ausnutzen können.

Welche Weise könnten Unternehmen denn solche Datenbestände nutzbringend einsetzen?
Es gibt bereits einige Fälle, in denen Dunkle Daten genutzt wurden. Fitness-Tracker etwa, deren primärer Zweck es ist, meine persönliche Gesundheit und mein Wohlbefinden zu verbessern. Doch daneben gibt es eine Bandbreite weiterer Möglichkeiten, wie diese Bewegungs- und Aktivitätsdaten genutzt werden könnten. Rein theoretisch ließe sich so der gesamte Alltag einer Person rekonstruieren, als auch sein Verhalten in bestimmten Situationen analysieren.

Kennen Sie da einen konkreten Fall?
Ja, Fitness-Tracking Daten werden bereits jetzt abseits ihres eigentlichen Zweckes genutzt: Bei Versicherungen. John Hancock, eine der größten Lebensversicherungen in Nord-Amerika, bietet seinen Versicherten Bonus-Optionen und Belohnungen, wenn die eigenen Fitness-Tracking Daten zur Einschätzung bereitgestellt werden. Mittlerweile wurde veröffentlicht, dass John Hancock nur noch „interaktive Verträge“ mit Optionen für digitale Fitness-Tracking Daten von tragbaren Geräten vergibt. Wer nicht protokolliert, bekommt keine Rabatte.

Also die Einteilung in gute und schlechte Kunden. Das ist für den Versicherer vermutlich sehr effizient, aber aus Kundensicht ein eher negatives Anwendungsbeispiel.
Ja, das veranschaulicht, dass die Erschließung dunkler Daten nicht immer positive Folgen haben muss. Doch es gibt auch andere Beispiele, etwa aus dem Monitoring, wo Sensordaten wertvolle Grundlagen für neue Analysen bilden. Das reicht bereits hinein bis in die Landwirtschaft, wo Dunkle Daten genutzt werden, um Vorhersagemodelle für Erträge basierend auf Umweltfaktoren und Ernährung zu erstellen.

Leider steht dem Nutzen auch ein großes Missbrauchspotenzial gegenüber. Der Handel mit persönlichen Daten ist ein großes Geschäft und viele erkennen, dass Daten das Öl unserer Zeit sind. Gleichzeitig sind wir sehr sorglos. Man hört häufig Aussagen wie: „Ich habe nichts zu verheimlichen.“ Unterschätzt wird dabei häufig, wie leicht sich derartige Informationen für unlautere Zwecke nutzen lassen. Ist ein solches digitales Profil über uns vorhanden, stellt sich die Frage, wofür es genutzt wird und ob wir selbst darauf überhaupt Einfluss nehmen können. Können wir uns von einem digitalen Etikett rehabilitieren? Das Negativbeispiel ist China mit seinem System der „Social Credits“.

Wie sollten Unternehmen auf das Missbrauchspotenzial reagieren?
Wichtig ist: Sie – eigentlich wir alle – müssen über Verantwortung sprechen. Wenn wir unsere Entscheidungen auf Daten und Analysen stützen, müssen wir besprechen, wer die Verantwortung für die Entscheidungen übernimmt und wie man verantwortungsvoll mit den Tools umgeht. Wir können uns nicht davon lossagen und auf den Algorithmus zeigen. Das ist ein Punkt, den wir in unserer Fachhochschule intensiv in der Ausbildung aufgreifen – langfristig muss hier jedoch der Gesetzgeber ran.

Bildquelle: Privat

©2019Alle Rechte bei MEDIENHAUS Verlag GmbH

Unsere Website verwendet Cookies, um Ihnen den bestmöglichen Service zu bieten. Durch die weitere Nutzung der Seite stimmen Sie der Verwendung zu. Weitere Infos finden Sie in unserer Datenschutzerklärung.

ok