Rege Beteiligung der Open-Source-Gemeinde

Mehr Sicherheit für Hadoop

Wachsende Anwenderzahlen sorgten für rege Beteiligung der Open-Source-Gemeinde am Hadoop Summit in Dublin Mitte April 2016. Klare Trends waren der Kundenwunsch nach mehr Unterstützung bei der Identifizierung von Anwendungsfällen, mehr ­Sicherheit, eine einfachere Handhabung des Apache-Frameworks und die Einbindung von Cloud-Strukturen.

Hadoop Summit

Mitte April 2016 fand der Hadoop Summit in Dublin statt.

Die in Dublin versammelten Hadoop-Anbieter sehen den Entwicklungen positiv entgegen und erwarten steigende Zahlen in ihren Geschäftsfeldern, auch aufgrund des Ausbaus von Internet-of-Things-Anwendungen. So stellte MapR die erweiterte „Converged Data Platform“ mit neuen Datenbank- und Container-Funktionen vor. Daneben präsentierte der Anbieter Cloudera die analytische Datenbank Apache Impala, die speziell auf die massive Parallelverarbeitung von Daten ausgelegt ist.

Die Partnernetzwerke aller Distributoren werden ständig erweitert und bieten Kunden die Möglichkeit, Lösungen anderer Anbieter zu benutzen. Die enge Beziehung von Hortonworks und Pivotal etwa führt dazu, dass der Software-Anbieter künftig die Hortonworks Data Platform (HDP) als Reseller vertreibt und damit die Hadoop-native SQL-Datenbank HDB auch für Hortonworks-Kunden verfügbar wird. Durch die  Zusammenarbeit mit Syncsort soll zudem die Migration auf HDP für Mainframe-Kunden vereinfacht werden, indem Hortonworks das ETL-Tool DMX-h in seine Plattform integriert.

„Viele Unternehmen befinden sich noch am Anfang und beginnen gerade mit ihren ersten Projekten. Daher gehören Wissenstransfer und Weiterbildung in Form von Trainings zu den wichtigsten Aufgaben“, beschreibt John Kreisa, Vice President bei Hortonworks, den wachsenden Bedarf der Kunden bei der Auslotung von Einsatzgebieten, den alle Hadoop-Anbieter sehen.

Gerade Neukunden wünschen verstärkt die Unterstützung bei der Nutzbarmachung ihrer Daten. Entsprechend wurden mehr Workshops, Crashkurse und Vorträge für die Summit-Teilnehmer angeboten. Die Sessions deckten Bereiche wie strategische Ausrichtung, Entwicklung oder auch die Implementierung der Pilotprojekte ab, als Anleitung für Felder wie Data Governance oder Business Intelligence. Auch Partnerunternehmen wie HP, Teradata oder Microsoft sowie Anwender wie Renault oder ING Diba teilten ihre Erfahrungen bei der langfristigen Entwicklung von Big-Data-Projekten und -Infrastrukturen.

 

Sicherheit und Governance


Desweiteren bleibt Cybersecurity ein dominierendes Thema, das alle Anbieter bei ihren Kunden sehen. Das Konzept von Hortonworks nutzt etwa die Projekte Apache Ranger und Apache Atlas, die eine gestaffelte Phalanx aus Datensicherheit und Governance anbieten sollen. Beide Tools sind voll in HDP integriert und arbeiten über gemeinsame Ressourcen zusammen. Geladene Daten können beispielsweise mit Metatags in Atlas versehen und ihr Zugriff dann über entsprechende Protokolle in Ranger reglementiert werden.

Dies ist ein Artikel aus unserer Print-Ausgabe 05/2016. Bestellen Sie ein kostenfreies Probe-Abo.

Mit der wachsenden Komplexität steigt auch der Bedarf nach besserer Handhabung der Hadoop-Umgebung. Das Management-Tool Apache Ambari hat daher ein grafisches Interface statt der reinen Kommandozeile für die Überwachung der Hadoop-Cluster erhalten und soll in Kombination mit den Optimierungsfunktionen des Dienstes Smartsense die Diagnose von Pro­blemen künftig deutlich erleichtern.

„Künftig wird eine Bündelung der Funktionen in nachvollziehbare Gruppen erfolgen, damit wir die Daten auch für Mitarbeiter jenseits des Data Scientists verfügbar machen. Das Ziel wäre, den Endnutzer nicht mehr direkt den Strukturen auf Datenebene aussetzen zu müssen“, spricht Hortonworks-CTO Scott Gnau an, dass immer mehr Mitarbeiter die gewonnenen Erkenntnisse einsetzen sollen.

Die Option, Cloud-Strukturen einzubinden, ist und bleibt ein wichtiges Kriterium für Anwender. Cloudera und MapR haben bereits länger entsprechende Konzepte in ihrem Programm, jetzt zieht Hortonworks mit Cloudbreak nach und bietet eine entsprechende Option für die Cloud-Migration von Hadoop-Clustern an.

Cloudbreak kann mit Amazon Web Services, Microsoft Azure und Google Cloud Platform verwendet werden, mit Openstack auch in einer On-Premise-­Mischumgebung. Die Hadoop-as-a-Service-Lösung ist zudem kompatibel zu Docker-Containern und kann Hadoop-Cluster automatisiert auf jeder Hardware aufspielen.

©2020Alle Rechte bei MEDIENHAUS Verlag GmbH

Unsere Website verwendet Cookies, um Ihnen den bestmöglichen Service zu bieten. Durch die weitere Nutzung der Seite stimmen Sie der Verwendung zu. Weitere Infos finden Sie in unserer Datenschutzerklärung.

ok