Wertvolle Metadaten schützen

Durchdachte Storage- und Backup-Strategien

Datenvolumina im Petabyte-Bereich sind in den meisten Unternehmen keine Seltenheit mehr, auch da immer mehr Daten gehortet als gelöscht werden – ­dementsprechend werden immer ausgefeiltere Speicher- ­und Archivierungsstrategien benötigt.

Schloss

Wer auf einen goldenen Datenmanagement-Weg hofft, wird enttäuscht.

Als die ersten externen Festplatten für den Heimgebrauch mit Terabyte-Speicher auf den Markt kamen, dachten viele: „Wie soll ich jemals so viele Daten zusammenbekommen?“ Kurze Zeit später fragten die ersten nach einer 2TB-Festplatte. Zentrale Server zu Hause, remote Speichermöglichkeiten und die Cloud in ihren unterschiedlichen Erscheinungsformen haben die Denkweise bezüglich Datensicherung geändert. Daten werden nur selten gelöscht, durch die Aufbewahrung an mehreren Orten gleichzeitig sind sie vor allen Eventualitäten abgesichert – gleichzeitig soll der Zugriff von überall aus möglich sein.

Laut einer IDC Studie aus dem letzten Jahr machen unstrukturierte Dateien wie Videos, Bilder, Entwürfe und Aufzeichnungen 80 Prozent des Datenwachstums bei Unternehmen aus. Allerdings sind nicht alle Daten gleich wichtig: Auf manche wird regelmäßig, auf andere nur selten zugegriffen. Durch die Festlegung von Richtlinien, die diese inaktiven Daten automatisch vom teuren Primary Storage auf Archivierungsmedien verschieben, können Kosten gespart und Ressourcen geschont werden. Gleichzeitig muss der problemlose Zugriff auf archivierte Daten gewährleistet werden.

Im Unternehmensumfeld ist die Datenspeicherung und -sicherung eine komplexe Angelegenheit, da die Anzahl der Daten und Quellen beständig wächst, sodass die händische Verwaltung nicht mehr effizient gehandhabt werden kann. Die Verschiebung der Daten vom Primärspeicher auf die Archivierungsebene muss automatisiert ablaufen, um den Zeitaufwand zu reduzieren. Zudem reicht die traditionelle Storage-Technologie nicht mehr aus, um Datenvolumina im Petabyte-Bereich zu verwalten, da sie in Verlässlichkeit und Effizienz nicht die Anforderungen erfüllen und zu teuer sind.

Wer auf einen goldenen Datenmanagement-Weg hofft, wird enttäuscht. Was für ein Unternehmen die ideale Lösung darstellt, kann in einem anderen kontraproduktiv sein. Je nach Geschäftsziel muss eine flexible, maßgeschneiderte und mehrstufige Architektur aus z.B. Tape Libraries, Disk, Object Storage oder Cloud implementiert werden.

Sicherung der Metadaten

Dateien bestehen aus zwei Komponenten: Dem Inhalten selbst sowie den zugehörigen Metadaten, welche für die Klassifizierung und Lokalisierung der Dateien eine entscheidende Rolle spielen. Sie geben Auskunft über die Herkunft der Daten, ihre Zusammensetzung, kodieren Regeln für die Transformation der Daten aus den Quelldatenbeständen und liefern Information über verdichtete Daten und deren Hierarchien.

Die Erfassung und Pflege von Metadaten stellt einen  Teil des Verwaltungsprozesses dar. Die Sicherung und Archivierung vernachlässigen viele Unternehmen bereits. Gehen Metadaten verloren, ist es beinahe unmöglich, die entsprechenden Inhalte rechtzeitig zu finden, damit wird die Inhaltsbibliothek praktisch nutzlos.

Metadaten und Inhalte werden getrennt aufbewahrt, da sich aufgrund der Dateigrößen die Zugriffsmuster unterscheiden. Handelt es sich bei den Dateien beispielsweise um Videos, kann das Volumen einer einzigen Datei mehrere hundert Giga- oder Terabytes ausmachen – es ist sinnvoll, sie auf Speichermedien mit hohen Kapazitäten und niedrigen Latenzzeiten zu sichern und bei Bedarf per Stream abzurufen, um eine flüssige Wiedergabe zu ermöglichen und Dropped Frames zu vermeiden. Die Metadaten hingegen beanspruchen weniger Kapazität – manchmal sind es nur wenige Kilobytes, da der Großteil der Informationen aus einer Textdatei oder einem Datenbankeintrag besteht, weshalb Metadaten auf traditionelleren Speichermedien gesichert werden können.

Automatisierung durch Erstellung von Richtlinien

Zunächst müssen Richtlinien und Regeln für die Archivierung von Daten erstellt werden, welche die folgenden Punkte beachten:
– Je nach Datentyp gelten unterschiedliche Kriterien für die Archivierung
– Einstellung der Mechanismen, die für den Archivierungsprozess zum Einsatz kommen
– Festlegung der Archivierungsmedien
– Festlegung des Zeitraums, in dem die Daten im Archiv bleiben; abhängig vom Datentyp
– Festlegung der Zugriffsrechte für unterschiedliche Nutzer
Die Daten werden klassifiziert und abhängig vom Datentyp, ihrem Wert und Zugriffszeiten auf unterschiedlichen Speicherebenen archiviert. Die Speicher- und Archivierungsvorgänge müssen zudem geschäftsrelevant sein und über die Möglichkeit verfügen, den Speicherort und die Datenbewegung mit Parametern wie Datenquelle, Datentyp, Nutzer und weiteren organisationalen und prozessualen Unternehmensinformationen zu verknüpfen.

Bezüglich der Metadaten sollten Unternehmen Richtlinien erstellen, Durch die die Metadaten bereits von Erstellung einer neuen Datei an über alle Stufen des Workflows hinweg zuverlässig gesammelt werden. Sind die Inhalte finalisiert und werden archiviert, sollten gleichzeitig auch die Metadaten archiviert werden, um sie später für die Mehrfachnutzung wieder heranziehen zu können. Das klingt zunächst nach viel Aufwand, bietet jedoch ein Einsparpotential, ohne den Anwender in seiner täglichen Arbeit in Mitleidenschaft zu ziehen.

 

Fünf Tipps für das ­passende Speicherkonzept

1. Zwischen Archivierung und Backup unterscheiden, um ­Kosten zu senken.
2. Proprietäre Formate vermeiden – das birgt die Gefahr, dass im schlimmsten Fall Daten in ein paar Jahren nicht mehr lesbar sind.
3. Zeit in die Regelfindung investieren – das spart in Zukunft Ärger und erneuten Zeitaufwand.
4. Auch für die Löschung von Daten Regeln implementieren.
5. Auf keinen Fall die Metadaten vergessen – so bleiben Inhalte auch langfristig auffindbar.

 

Storage- und Archivierungs­lösungen im Überblick

Mit Tape Libraries können vergleichsweise kostengünstig große Datenmengen gesichert werden, bei häufigen Bandwechseln bringen sie jedoch einen hohen Konfigurations- und Verwaltungsaufwand mit sich. Sie bieten sich vor allem für das Staging und die langfristige Archivierung an.

Backup-to-Disc bietet eine höhere Datenübertragungs­geschwindigkeit als Bänder. Da Disks nur über begrenzte Speicherkapazitäten verfügen, werden sie häufig für die Langzeitarchivierung in Kombination mit Tape eingesetzt, was dem Prinzip einer mehrstufigen Archivierungsstrategie entspricht.

Object-Storage-Systeme sind bezüglich der Skalierbarkeit nicht limitiert, ermöglichen verteilte Zugriffe und unter­stützen individualisierbare Metadaten. Ein weiterer Vorteil von Object Storage liegt darin, dass Daten global auf ­Rechenzentren an verschiedenen Standorten verteilt werden können; je nach Object-Storage-System sogar über heterogene Disks und Knoten.

Cloud Storage – Ähnlich wie bei Object Storage bietet die Cloud ­Zugang zu einem quasi unbegrenzten externen Speicherpool, auch die Datensicherung über mehrere Standorte ­hinweg ist problemlos möglich. Bei einer langsamen Ver­bindung kann sich das Hochladen großer Datenmengen als problematisch erweisen.

Quelle: Quantum


Bildquelle: Thinkstock/iStock

©2021Alle Rechte bei MEDIENHAUS Verlag GmbH

Unsere Website verwendet Cookies, um Ihnen den bestmöglichen Service zu bieten. Durch die weitere Nutzung der Seite stimmen Sie der Verwendung zu. Weitere Infos finden Sie in unserer Datenschutzerklärung.

ok