Unstrukturierte Daten

Labeling: Schutz in fluiden Infrastrukturen

Das Labeling unstrukturierter Daten ermöglicht deren Schutz unabhängig von der jeweiligen Infrastruktur entsprechend dem Business-Kontext. Es schafft eine umfassende „Information Intelligence“, die über Sicherheitsmaßnahmen hinaus auch eine treffsichere Konfiguration von Anwendungen wie Backup und Archivierung ermöglicht.

Die Verbindung von Datei und Label wird technisch meist durch eine Speicherung in den Metadaten einer Datei realisiert.

Die Verbindung von Datei und Label wird technisch meist durch eine Speicherung in den Metadaten einer Datei realisiert.

Information Intelligence geht aus der Klassifizierung und Etikettierung unstrukturierter Daten hervor, also beispielsweise von PDF-, Word- oder sogar TXT-Dateien. Ziel ist es, den Business-Kontext bzw. den Inhalt einer Datei unabhängig von ihrem Speicherort jederzeit zu erkennen. Jede Datei erhält eine oder mehrere Etiketten oder Labels, die dauerhaft mit den Dateien verbunden bleiben. Dateien sind bekanntlich beweglich, sie können kopiert, verschickt und an unterschiedlichen Orten gespeichert werden – ihre Labels sind eine Kennzeichnung, die sie einer definierten Kontext-Klasse zuweist und die sich mit der Datei bewegt.

Ein Unternehmen kann einer Datei beispielsweise drei Labels auf unterschiedlichen Klassifizierungsebenen geben: Confidential als Kennzeichnung der Vertraulichkeit, HR für die Organisationsstruktur und Retention Period fünf Jahre für die Dauer der Aufbewahrung. Durch die Kombination solcher Labels, die man natürlich noch viel granularer vergeben kann, wird ein Kontext hergestellt, der zeigt, worum es sich bei der betreffenden Datei handelt. In diesem Fall: Vertrauliche Informationen aus der Personalabteilung, also kritische Daten, die damit automatisch einer erhöhten Sicherheitsstufe angehören.

Diese Informationen über den Charakter der Daten ergeben sich, und das ist von zentraler Bedeutung, nicht wie in herkömmlichen Konzepten aus dem Ort, an dem sich die Datei befindet. Die Daten sind also nicht deshalb kritisch, weil sie im HR-Ordner oder in Verbindung mit einer HR-Applikation gespeichert wurden, sondern nur weil sie die entsprechenden Labels mit sich führen.

Die Verbindung von Datei und Label wird technisch meist durch eine Speicherung in den Metadaten einer Datei realisiert, was entsprechende Tools erledigen. Auch nicht gängige Dateiformate oder gar solche, die gar keine Metadaten unterstützen wie CSV oder TXT, können von solchen Tools mit Abstrichen verarbeitet werden, indem die Klasseninformationen in den Verschlüsselungs-Header oder das Dateisystem geschrieben werden.

Natürlich kein Selbstzweck


In herkömmlichen IT-Konzepten ging man normalerweise von der Infrastruktur aus, sie bildete das Fundament des (logischen) Gebäudes. Mit zahlreichen Policies und Regeln versuchte man dann festzulegen, dass die Daten dieser Infrastruktur zu folgen haben. Um beim vorherigen Beispiel zu bleiben: HR-Daten dürfen nur in den HR-Verzeichnissen gespeichert werden, weil sie dort entsprechend ihrer Funktion geschützt werden.

Dieses Modell wurde jedoch problematisch durch das Verschwimmen einer festen, jederzeit kontrollierten Infrastruktur, so z.B. im Bereich Cloud oder Mobilität. Der Ansatz der dateibasierten Information Intelligence trägt dem Rechnung; Basis des „IT-Gebäudes“ sind dann die Informationen selbst bzw. der Content der unstrukturierten Dateien, der durch die Klassifizierung sichtbar wird. Erst darauf bauen die Infrastrukturentscheidungen auf. Die IT folgt hier dem Business und seinen Daten und wartet nicht vergebens auf das Umgekehrte.

Klassifizierung ist natürlich kein Selbstzweck, sondern die Voraussetzung für die Implementierung von content-basierten Prozessen und Anwendungen. Auf der Basis der durch das Klassifizierungskonzept erreichten Infrastrukturunabhängigkeit lassen sich z.B. sehr genau Sicherheitsmaßnahmen wie Digital Rights Management (DRM) oder auch Anwendungen für Backup und Archivierung konfigurieren. Klassifizierung bzw. Labeling sind generell die Grundlage, um zu wissen, was mit welcher Datei passieren soll.

Ist eine Datei beispielsweise mit Digital Rights Management geschützt, kapselt sie sich durch drei Aspekte ab: die Klasse bzw. das Label, die Zugriffsrechte und schließlich der Schutz durch die Verschlüsselung. Mit diesen drei Elementen wird die Datei zu einer autonomen Einheit und geht damit auf Reisen, egal ob sie per E-Mail verschickt, auf einem USB-Stick, in der Cloud oder auf einem Smartphone gespeichert wird. Auf diese Weise wird sie laut NTT Security den veränderten Bedingungen der heute mehr und mehr üblichen fluiden Infrastrukturen optimal gerecht.

Bildquelle: Thinkstock/DigitalVision

©2018Alle Rechte bei MEDIENHAUS Verlag GmbH

Unsere Website verwendet Cookies, um Ihnen den bestmöglichen Service zu bieten. Durch die weitere Nutzung der Seite stimmen Sie der Verwendung zu. Weitere Infos finden Sie in unserer Datenschutzerklärung.

ok