05.12.2017 Datenhandel

Big Data: Woher nehmen, wenn nicht stehlen?

Von: Ina Schlücker

Datenhandel hat sich mittlerweile zu einem lukrativen Geschäft entwickelt. Prof. Dr. Thomas Hess vom Forum Privatheit erläutert im Interview, wie Unternehmen über Open Data hinaus mit legalen Quellen ihre Datenbasis erweitern können.

  • Big Data: Woher nehmen, wenn nicht stehlen?

    Immer mehr Geschäftsmodelle basieren auf Daten, darunter persönliche Kundendaten oder Sensordaten aus dem Internet der Dinge. Doch wie wandern diese legal in diee Datentöpfe von Unternehmen?

  • Prof. Dr. Thomas Hess, Forum Privatheit

    Prof. Dr. Thomas Hess ist Mitglied des vom Bundesministerium für Bildung und Forschung (BMBF) geförderten Forschungsgremiums „Forum Privatheit“ und Director beim Institute for Information Systems and New Media Munich School of Management der Ludwig-Maximilians-Universität München (LMU).

ITM: Herr Hess, Big-Data-Analysen und Künstliche Intelligenz funktionieren am effizientesten mit einer umfangreichen und konsistenten Datengrundlage. Doch aus welchen Quellen können Unternehmen – über ihre eigenen Datenbanken hinaus – entsprechende Daten beziehen?
Thomas Hess:
Unternehmen können mittels sogenannter Sekundärmärkte gegen Bezahlung auf Datenbestände dritter Unternehmen zugreifen und somit ihre Datenbasis erweitern. Eine weitere Möglichkeit ist das „Data Sharing“, bei dem Unternehmen sich, in Umfang und Zeitraum beschränkt, gegenseitig den Zugriff auf Daten ermöglichen.

ITM: Welche Rolle spielen hierbei frei zugängliche Datenquellen wie Open Data?
Hess:
Open Data bezeichnet keine Form von Datenhandel sondern Daten, die restriktionslos zugänglich sind. Unternehmen können auf Daten aus solchen Quellen nicht nur kostenfrei zugreifen, sondern diese auch mit ihren eigenen Daten verknüpfen, verändern oder verbreiten.

ITM: Wie hat sich der Datenhandel im digitalen Zeitalter im Vergleich zur analogen Vergangenheit verändert?
Hess:
Im analogen Zeitalter lag der Fokus primär auf Stammdaten, die eine gewisse Konstanz im Zeitverlauf aufweisen, z.B. Alter, Geschlecht oder Wohnort eines Kunden. Durch die Allgegenwärtigkeit digitaler Technologien haben das Volumen und die Vielfalt an verfügbaren Daten stark zugenommen, möglich ist es nun auch dynamischere Daten, wie das Nutzungsverhalten von Individuen, aufzuzeichnen. Durch digitale Technologien ist es heutzutage in Echtzeit möglich diese Daten zu generieren, weiterzuverarbeiten und mit ihnen zu handeln.

ITM: Mit welchen Methoden und Technologien kommen die Online-Plattformen an die gehandelten Daten?
Hess:
Persönliche Daten werden beispielsweise durch das Nutzen von Online-Services wie sozialen Netzwerken preisgegeben. Zudem können Nutzer und deren Verhalten im Internet über einzelne Websites hinaus nachverfolgt werden (sogenanntes Tracking). Hierzu werden unterschiedliche Verfahren zur webseitenübergreifenden Identifikation eingesetzt, wie etwa klassische HTTP-Cookies oder aber auch neuere Methoden wie das Browser-Fingerprinting.

ITM: Inwieweit bewegen sich die Datenhändler dabei innerhalb legaler Grenzen? Wann wird ihr Vorgehen illegal?
Hess:
Aus datenschutzrechtlichen Gründen nutzen Unternehmen Daten mit Personenbezug, die ohne aktive und freiwillige Zustimmung des Nutzers erhoben wurden, stets anonymisiert. Die aktuelle Rechtslage versteht unter Anonymisierung die Modifikation personenbezogener Daten, in solchem Ausmaß, dass diese nur unter unverhältnismäßig großem Aufwand an Zeit, Kosten und Arbeitskraft einer natürlichen Person zugeordnet werden können. Stets illegal ist dahingegen die Datenbeschaffung über Hacking oder Schwarzmärkte im sogenannten Darknet, auf denen z.B. mit Kreditkartendaten oder Patientenakten gehandelt wird.

ITM: In welcher Größenordnung bewegen sich die Preise für Daten? Sind Personen- oder Gesundheitsdaten per se teurer als Konto- oder IoT-Daten?
Hess:
Eine generelle Aussage ist nicht möglich, da die Preise stark kontextabhängig sind. Bei Personendaten lässt sich aber feststellen, dass Daten umso teurer sind, je spezifischer die Information ist, die sie liefern. Beispielsweise sind Informationen über Krankheiten (z.B. Glutenunverträglichkeit) rund dreimal so viel Wert wie Berufsangaben.

Bildquelle: Thinkstock/iStock

©2017 Alle Rechte bei MEDIENHAUS Verlag GmbH