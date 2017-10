Geodaten, Statistiken, Verkehrsinformationen, wissenschaftliche Publikationen und Lehrmaterial, medizinische Forschungsergebnisse oder Hörfunk- und Fernsehsendungen werden gerne als „Open Data“ betrachtet. Es kann sich um Datenbestände von Behörden, Ministerien, Parlamente und Gerichten, aber auch um Daten privatwirtschaftlich agierender Unternehmen, Hochschulen sowie Non-Profit-Einrichtungen handeln. Wichtig ist nur, dass offene Daten weder personenbezogen sein noch dem Datenschutz unterliegen dürfen.

Umstrittene Eigentumsverhältnisse

Daten und Datenbanken werden international mit unterschiedlichen Regelungen und Gesetzen als geistiges Eigentum geregelt. Während bei Software und Inhalten das Urheberrecht die relevanten Regelungen beinhaltet, sind für Datenbanken teilweise zusätzliche,teilweise aber auch komplett andere Regelungen bestimmend. In der EU existiert zum Beispiel eine spezielle Datenbank-Direktive, während in den USA das Copyright für Datenbanken gar nicht gilt. Aus diesem Grund lizenzieren die ODC-Lizenzen das Copyright bzw. Urheberrecht, spezielle Datenbankrechte, Patentrechte und Warenzeichen. Organisationen wie Die Open Knowledge Foundation Deutschland und die Dachorganisation Open Knowledge International, aber auch das Fraunhofer-Institut oder die Deutsche Bahn engagieren sich an dieser Stelle.

Bei der Arbeit der Landesverwaltung und bei den Kommunen – beispielsweise in NRW – fallen unzählige Daten an. Die waren zum Teil auch vorher schon öffentlich, man musste aber aufwändig danach suchen. Auf dem Portal Open.NRW beispielsweise werden erstmals alle offenen Daten der Landesregierung und eine Vielzahl an kommunalen offenen Daten gebündelt. Sie sind kostenfrei, maschinenlesbar, übersichtlich und dauerhaft verfügbar.

„Künstliche Intelligenz“ und Big Data

Angesichts der mit z.B. mit Blockchain- oder Geolocation-Technologien erzeugten oder der durch „Künstlicher Intelligenz“ und Big-Data-Analysen „veredelten“ und immer schneller wachsenden Datenbestände ist der Bedarf für solche Lizenzen unübersehbar, auch wenn vielerorts die Daten noch ohne rechtliche Klärung der Eigentumsverhältnisse gemeinsam benutzt werden. Die Linux Foundation will mit CDLA dafür sorgen, dass bei der Nutzung von freien und offenen Daten von Anfang an Klarheit herrscht.

Das jetzt vorgeschlagene „Community Data License Agreement“ kommt in zwei Varianten: Sharing (dem Geist der „GNU General Public License“ v3 folgend) und Permissive (eher einer Apache2.0- oder BSD-Lizenz entsprechend). Die Sharing-Lizenz soll zur Rückgabe von Daten an die Community ermutigen, während die Permissive-Lizenz keinerlei zusätzliche Bedingungen an die Empfänger oder Spender von Open Data stellt.

„Frictionless sharing“

„An open data license is essential for the frictionless sharing of the data that powers critical technologies“, sagte Jim Zemlin, Executive Director der Linux Foundation. „The success of open source software provides a powerful example of what can be accomplished when people come together around a resource and advance it for the common good. The CDLA is a step in that direction and will encourage the continued growth of applications and infrastructure.“ Allerdings bringt CDLA einige grundsätzliche Implikationen und Ansprüche mit sich:

Datenproduzenten können für mehr Klarheit sorgen, was die Empfänger mit den offenen Daten tun dürfen. Sie können je nach Interessenlage zwischen Sharing- und Permissive-Lizenzen wählen. Außerdem haben sie Klarheit über die anerkannten Klauseln und Haftungsausschlüsse ebenso wie über Garantien und Verpflichtungen.

Open Data Communities, wie sie nicht nur in Deutschland, sondern auch in Großbritannien oder Nordamerika entstehen, können die Rechte im Umgang mit den Daten auf eine Lizenz oder einige wenige Lizenzen standardisieren. Das sorgt für eine ausgewogene Balance zwischen den Rechten der Produzenten und der Nutzer von Daten. CDLA gewährt den Benutzern laut Zemlin viel Flexibilität dabei, eigene Governance-Regeln und Anforderungen im Umgang mit ihren Daten zu definieren, insbesondere für den Umgang mit Daten, die Personen zugeordnet werden könnten.

Datennutzer, die nach größeren Datenbeständen suchen (beispielsweise für das Training ihres KI-Systems), finden solche Daten, die einem bekannten Lizenzmodell unterliegen, das ihre Rechte und Pflichten als Datennutzer klar und eindeutig definiert.

„Shared data licensing will do for machine learning and the next phase of information technology evolution what the GNU General Public License and the free software ethos it embodied did for primary software production over the last generation“, sagte Eben Moglen, Professor für Recht an der Columbia Law School. „Clearly expressed, well-designed rules for ‘share alike’ treatment of collaboratively-produced data will enable massive cooperation and help us resist over-concentrated ownership of the resource most crucial to 21st century social and economic development.“

Das gemeinnützige Firmenkonsortium Linux Foundation wurde im Jahr 2000 als „Open Source Development Labs“ gegründet. In der heutigen Form existiert es seit dem Zusammenschluss von OSDL und der „Free Standards Group“ (FSG) in Jahr 2007. Ziel des ist es, das Wachstum von Linux und Open Source zu unterstützen und zu fördern. Zu den Mitgliedern gehören Firmen wie Unix-Erfinder AT&T, Internet-Pionier Cisco und Hardware-Hersteller wie Fujitsu, HPE, IBM oder Intel.

Bildquelle: Opendatainside