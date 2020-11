Von: Berthold Wesseler

{newsItem.falMedia[0]}

Ab Mitte März 2021 – mit Inbetriebnahme des neuen HSM – können jährlich bis zu 120 Petabyte neu generierte Daten abgespeichert werden. HSM ersetzt das vorhandene Datenarchiv auf Basis des „High Performance Storage Systems“ (HPSS), das seit 2009 mit Oracles Storagetek-Bibliotheken der Baureihe SL8500 und IBM-Software realisiert worden war. Die darin vorhandenen Daten werden vom Oracle-Bandformat auf den Standard „Linear Tape Open“ (LTO) migriert – und zwar unter Verwendung der offenen Standards „Linear Tape File System“ (LTFS) und S3.

Die auch mit IBM i nutzbare Daten- und Speicherressourcen-Verwaltungssoftware Stronglink wird in einer Scale-Out-Architektur bereitgestellt. Das darauf aufbauend von Cristie Data konzipierte Speichermanagementsystem soll die erwähnten 120 Petabyte pro Jahr zwischen der Speicher-Infrastruktur der Supercomputer und dem neuen HSM-System transferieren.

Zu diesem Zweck virtualisiert Stronglink den 1 Petabyte großen Cache und die insgesamt neun Bandarchive. Auch dank der 1 PB Festplatten-Cache soll das neue HSM eine Transferrate von 15 Gigabyte/s erreichen. Die Konvertierung der Bestandsdaten (150 PB) auf das neue LTFS-Format erfolgt automatisch parallel zum Lesen und Schreiben neuer Daten und transparent für die Nutzerinnen und Nutzer. Die Parallelisierung erstreckt sich über zirka 90 Bandlaufwerke in neun Bandarchiven, die gemeinsam mehr als 79.000 Medienstellplätze zur Verfügung stellen.

Mithilfe der Stronglink-Architektur ist es möglich, die bereits am DKRZ vorhandenen 150 Petabyte an Klimamodelldaten der vergangenen 30 Jahre vom bisher genutzten HPSS innerhalb von einer Woche automatisiert in das neue HSM zu übernehmen. Der Hersteller Strongbox Data Solutions bringt hierzu über 12 Jahre Erfahrung in der Virtualisierung von Daten-Workflows zwischen Band und Festplatte ein. Die Software Stronglink ist eine herstellerneutrale Lösung zur Automatisierung der Datenverwaltung über ansonsten inkompatible Speichertypen hinweg, einschließlich Flash-, Festplatten-, Band- und Cloud-Speicher für Datenumgebungen in jeder Größenordnung.

„Mit diesem neuen Archivsystem kann das DKRZ wichtige Datendienste für unsere Forschungsgemeinschaft erweitern, modernisieren und gleichzeitig nahtlos auf eine neue Plattform mit offenem Standard umsteigen[…]“, erläutert Prof. Thomas Ludwig, Geschäftsführer des DKRZ. Das neue HSM-System solle als „solide Grundlage“ sicherstellen, dass die Forschungsteams auf die Daten zugreifen können, die für die Klimamodellierung und verbesserte Klimaprojektionen erforderlich sind.

Installation und Konfiguration des neuen HSM-Systems am DKRZ übernimmt Cristie Data. Die Niedernberger liefern außerdem die gesamte für das Projekt benötigte Hardware und verantworten das Service- und Integrationsmanagement. „Mit Stronglink greifen Klimaforscherinnen und -forscher auf der ganzen Welt auch in Zukunft schnell und verlässlich auf alle Daten zu“, erkölärt Volker Wester, Geschäftsführer von Cristie Data. Mit Huawei setze man auf einen der Branchenführer für energieeffiziente RZ-Lösungen und leiste so einen Beitrag für umweltfreundlichere Lösungen im Rechenzentrum.

Cristie Data steht seit 50 Jahren für Speicher-, Backup- und Desaster Recovery-Systeme. Die 1969 im englischen Stroud gegründete Unternehmensgruppe betreut weltweit mehr als 300.000 Installationen der eigenen Bare-Machine-Recovery-Software. Cristie Data entwickelt Lösungen zu Datenspeicherung, Sicherheit von Daten und Datenmanagement, vor allem auch für intelligente Speicherverwaltung, Metadatenmanagement, Langzeitarchivierung und das Wiederfinden von Dateien.

Über das DKRZ

Das DKRZ ist eine zentrale nationale Serviceeinrichtung für Klima- und Erdsystemforschung. Die Hochleistungscomputer, Datenspeicher und Dienste bilden die zentrale Forschungsinfrastruktur für die simulationsbasierte Klimawissenschaft in Deutschland. Das Datenmanagementsystem gehört zu den größten der Welt. Das DKRZ stellt seine Ressourcen (Rechenzeit, Festplattenspeicher- und Archivierungskapazität, Beratung und Visualisierung) der Klimaforschung in Deutschland zur Verfügung.

Bildquelle: Deutsches Klimarechenzentrum GmbH