Big Data: Interview mit Thore Rabe, EMC Isilon

Datenspeicher für über 1.000 Berlinale-Filme

Interview mit Thore Rabe, Vice President EMC Isilon EMEA, darüber, dass die Berlinale während der zehn Filmfestspieltage vom 6. bis 16. Februar 2014 auf die Isilon-X-Serie als Datenspeicher für die über 1.000 teilnehmenden Filme setzte

Thore Rabe, EMC Isilon

Thore Rabe, Vice President von EMC Isilon EMEA

IT-DIRECTOR: Die Berlinale mit ihren zahlreichen Filmen ist ein schönes Beispiel für die Notwendigkeit, große Datenmengen bereitzustellen. Wie kam es zu der Partnerschaft mit der Berlinale?
T. Rabe:
EMC Isilon ist vor über zehn Jahren genau für solche Anwendungswecke entwickelt worden: große Datenmengen mit hohem Durchsatz an eine Vielzahl von Anwendern beziehungsweise Kunden zu verteilen. Große Teile der namhaften Produktions- und Medienfirmen nutzen heute bereits Isilon, weshalb die Partnerschaft naheliegend war. Denn aufgrund der immer ressourcenintensiveren Medienformate (HD, 3D, 4K) können die Anforderungen mit traditionellen NAS-Systemen nur noch schwer erfüllt werden, zumal die begrenzten Budgets eine einfach und schnell zu installierende Lösung erfordern, die ohne intensive Serviceleistung auskommt.

IT-DIRECTOR: Warum ist der architektonische Speicheransatz der EMC-Isilon-Systeme für die Bedürfnisse der Berlinale und anderer Anwender aus der Medien- und Unterhaltungsindustrie geeignet?
T. Rabe:
In der Vergangenheit war die Speicher-Infrastruktur im Produktionsablauf meistens von isolierten Speichersystemen geprägt. Beispielsweise gab es für Ingest, Schnitt, Spezialeffekte, Playout und vieles mehr verschiedene Systeme, zwischen welchen die Daten hin und her kopiert werden mussten. Dies ist sehr zeitaufwändig und auf Dauer nicht anwendbar. Durch seine Scale-Out Architektur sowie seine einfache Administration wird nun Isilon als zentrales Speichersystem verwendet, auf das alle Beteiligten über Standardprotokolle zugreifen können. Ein einziger Isilon-Knoten kann derzeit einen Streaming-Durchsatz von ca. 700MB/s (Megabit pro Sekunde) liefern, in Kürze werden es 1,2 Gbyte/s (Gigabit pro Sekunde) sein (derzeit können 144 Knoten in einem Cluster installiert werden). Sowohl der Zugriff auf die Daten als auch das Streaming erfolgt dabei über das standardisierte 10-Gigabit-Ethernet, eine SAN-Infrastruktur ist somit nicht notwendig.

Darüber hinaus können die Daten je nach Anforderung sehr flexibel auf den verschiedenen Ebenen (Protection Levels) geschützt werden. Das bedeutet, dass im Cluster durchaus drei Disks oder sogar drei vollständige Knoten ausfallen können, ohne dass Daten verloren gehen. Für temporäre oder transcodierte Daten kann gleichzeitig der Protection-Level auf N+1 gesetzt werden, da im Zweifel die Daten neu erzeugt werden können. Anders als bei traditionellen Systemen, bei denen das ganze System mit ein oder zwei RAID- Level abgesichert wird, erreicht man mit Isilon eine viel flexiblere und gleichzeitig effizientere Ausnutzung der vorhandenen Kapazität.

Die Nutzung als zentrales Speichersystem hat auch bei der diesjährigen Berlinale zu einer erheblichen Vereinfachung geführt: im letzten Jahr mussten alle Filme an über 40 FTP-Server ausgeliefert werden. Dies musste unter Berücksichtigung der Transferzeiten und Abspieltermine quasi rund um die Uhr geschehen. Dieser Aufwand entfällt durch den Einsatz von Isilon in diesem Jahr vollständig. Auf alle Filme kann ohne Verzögerung oder Planungsvorlauf sofort zugegriffen werden.

IT-DIRECTOR: Beim Stichwort Big Data geht es nun aber nicht nur um die Speicherung und Bereitstellung, sondern v.a. um die Analyse der Datenmengen und die Gewinnung neuer Erkenntnisse. Welchen Ansatz verfolgt ihr Unternehmen in diesem Bereich?
T. Rabe:
Hier gibt es zwei Aspekte: Zum einen können wir mit Isilon und dem Softwaremodul InsightIQ die Art der gespeicherten Daten und deren Nutzung erfassen – das bedeutet, erfassen, wie viele Dateien von welcher Größe es gibt. Oder wie oft sie gelesen oder geschrieben werden: Wie hoch ist der Datendurchsatz, die Auslastung der Disks, CPUs und Netzwerkressourcen? Dies erlaubt einen sehr guten Überblick über den eigenen Datenbestand, deren Nutzung sowie Trendanalysen.

Auf der anderen Seite steht die inhaltliche Auswertung der Daten mit modernen Analysemethoden wie dem Open-Source-Framework Hadoop. Hierfür haben wir bisher als einziger Hersteller das Hadoop Distributed Filesystem (HDFS) als Protokoll in unserem System implementiert. Mit entsprechenden Programmen kann direkt mittels HDFS auf die vorhandenen Daten zugegriffen werden, ohne diese erst auf separate HDFS-Cluster kopieren zu müssen. Dies führt zu einer enormen Zeitersparnis. Auch die Speichereffizienz ist mit ca. 80 Prozent wesentlich höher als auf nativen HDFS-Clustern, da dort alle Blöcke dreifach kopiert werden, um eine ausreichende Datenverfügbarkeit zu erreichen.

IT-DIRECTOR: Was wird beim Thema Big Data künftig wichtig? Worauf sollten Anwender achten, welche Entwicklung sollten große Unternehmen nicht verpassen?
T. Rabe:
Insgesamt wird der Begriff „Big Data“ in verschiedenen Zusammenhängen unterschiedlich verwendet. Mit Isilon als zentrale Komponente lassen sich attraktive private Cloud-Lösungen implementieren. Diese ermöglichen einerseits beständige Zugriffskontrolle, andererseits versorgen sie die Endbenutzer mit den gewünschten Funktionen. Es besteht die Möglichkeit, die Daten über mehrere Endgeräte zu synchronisieren oder sie mit anderen Benutzern sicher und kontrolliert zu teilen. Die finale Kontrolle verbleibt dabei in der eigenen IT-Abteilung, die die Zugriffsrechte über vorhandene Directory-Services verwaltet und bei Bedarf die Daten auf Endgeräten löschen kann. Dies geschieht beispielsweise, wenn ein Mitarbeiter die Firma verlässt oder ein Gerät gestohlen wurde. Die Daten können sowohl im eigenen Rechenzentrum auf einem Isilon System liegen oder bei EMC gegebenenfalls einem vertrauenswürdigen Anbieter gehostet werden.

Bei der Auswahl der Speichertechnologie sollte darauf geachtet werden, dass diese nicht nur die aktuellen Standardprotokolle wie NFS 3+4 sowie SMB 2+3 unterstützt, sondern auch REST-Interfaces bietet. Somit können die Daten über mobile Endgeräte auch über den Browser gelesen und geschrieben werden. Idealerweise werden gängige Quasi-Standards von OpenStack Swift oder S3 unterstützt, damit vorhandene Anwendungen hier ebenfalls verwendet werden.

Auch die Integrationsfähigkeit der Speichersysteme in Cloud-Umgebungen von VMware oder OpenStack sollte möglich sein. So lässt sich dafür ein Speichersystem nicht nur über eine Web-Userinterface oder Call-Level-Interface administrieren, sondern auch vollständig über eine API (Application Programming Interface). Bei Isilon ist die Entwicklung entsprechender Plugins für die eigene Umgebung durchführbar.

IT-DIRECTOR: Big Data hat es als z.T. unscharfer Begriff bis in die Feuilletons der großen Tageszeitungen geschafft und wird dort eher negativ bewertet, als gefährliche, allwissende Durchleuchtung unserer Leben. Wie bewerten Sie diesen Diskurs?
T. Rabe:
In diesem Zusammenhang ist von der vielfältigen Massenspeicherung und vor allem der umfangreichen Auswertung der Daten die Rede. Eine ganz selbstverständliche Big-Data-Anwendung, von der wir täglich profitieren, ist die Wettervorhersage. Die Analysen und Algorithmen werden immer besser und niemand würde auf die Idee kommen, diese „klassische“ Big-Data-Anwendung zu hinterfragen.

Was die Speichertechnologie angeht, bietet Isilon zahlreiche Funktionen, um die Sicherheit im Betrieb zu erhöhen. So werden beispielsweise alle gängigen Authentifizierungsverfahren wie LDAP (Lightweight Directory Access Protocol), Active Directory und Kerberos unterstützt, ebenso wie eine vollständige, hardwarebasierte Verschlüsselung der gespeicherten Daten. Mit sogenannten Zugangsbereichen können Datenzugriffe auf bestimmte Netzadressen, Benutzergruppen und Datenbereiche beschränkt werden, so dass eine stärkere Kontrolle ohne zusätzliche Kosten umgesetzt wird.

©2019Alle Rechte bei MEDIENHAUS Verlag GmbH

Unsere Website verwendet Cookies, um Ihnen den bestmöglichen Service zu bieten. Durch die weitere Nutzung der Seite stimmen Sie der Verwendung zu. Weitere Infos finden Sie in unserer Datenschutzerklärung.

ok