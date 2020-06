Von: Berthold Wesseler

Heute kündigten auf der Frankfurter Online-Messe ISC 2020 Digital viele Serverhersteller High-Performance-Systeme auf Basis der neuen Nvidia-GPU A100 in einer Vielzahl von Designs und Konfigurationen an. Die Verfügbarkeit der Server variiert, wobei 30 Systeme in diesem Sommer und über 20 weitere bis Ende des Jahres erwartet werden. In der prominent besetzten Herstellerliste fehlt der Name IBM, da offenkundig der große Intel-Markt für Nvidia attraktiver ist als die mit IBM und Open Power adressierte spezielle Nische.

Neben mehr als 50 neuen Servern, die mit der A100-GPU für rechenintensive Anwendungsfelder wie KI, Datenwissenschaft und wissenschaftlichen Datenverarbeitung gedacht sind, stellte Nvidia auch eine neue KI-Plattform zur Minimierung von Ausfallzeiten in Supercomputing-Rechenzentren und Rekordergebnisse beim Big-Data-Analytics-Benchmark vor. Ebenfalls vorgestellt wurde die PCIe-Version der A100-Tensor-Core-GPU, Im Dauerbetrieb liegt die Performance im Schnitt 10 Prozent unter der des SXM4-Kollegen mit Nvidias proprietären Schnittstelle, Dafür verbraucht sie wie der Vorgänger V100-PCI nur 250 Watt, wohingegen das A100-Modul mit NVlink im Formfaktor SXM4 für 400 Watt ausgelegt ist.

Warum IBM – wie schon bei der T4-Ankündigung im vergangenen Jahr – in der Liste fehlt, ließ Nvidias Produktmanager Paresh Kharyam auf Anfrage von DV-Dialog in einer Vorab-Pressekonferenz offen. „Wir pflegen aber weiterhin eine enge Partnerschaft mit IBM“, sagte Kharyam, „Mehr kann ich zu diesem Zeitpunkt nicht sagen!“ Offen blieb auf unsere Nachfrage auch, ob die A100-GPU noch mit Power9 verbaut wird – oder ob sie erst mit Power10-Systemen im nächsten Jahr zu erwarten ist. Nvidia fokussiere sich nicht auf den Intel-Markt, sondern sei offen nach allen Seiten, sagte Kharyam. Erst im vergangenen Jahr habe man ja bekanntlich auch eine Partnerschaft mit dem Prozessorhersteller ARM geschlossen.

Der A100 ist der erste Grafikprozessor, der auf der neuen Ampere-Architektur basiert; die verwendete GA100-GPU ist mit 826 mm² und 54 Mrd. Transistoren der größte bisher in 7 nm gefertigte Prozessor. Nach der Einführung der Ampere-Architektur und des A100-Grafikprozessors im vergangenen Monat werden nun auf der ISC 2020 Digital mehr als 50 A100-basierte Server von Herstellern wie Asus, Atos/Bull, Cisco, Dell, Fujitsu, Gigabyte, HPE, Inspur, Lenovo, One Stop Systems, Quanta/QCT und Supermicro erwartet. Wann und wie IBM in diesen Markt einsteigt, bleibt offen. Immerhin hatten IBM und Nvidia mit Summit (148,6 Petaflops) am Oak Ridge Lab mehrere Jahre lang die Liste der leistungsstärksten Supercomputer der Welt angeführt.

Auf solche Erfolge sind die GPU-Pioniere stolz; immerhin steckt Technologie von Nvidia in acht der 10 schnellsten Supercomputer der Welt, wie aus der heute veröffentlichten Top500-Liste hervorgeht. Der auf Basis des A100 gebaute Supercomputer Selene debütiert hier als das schnellste Industriesystem der USA mit führender Energieeffizienz. Jetzt in Kombination mit Mellanox, treibt die Technologie von Nvidia zwei Drittel (333) der gesamten Top500-Systeme auf der jüngsten Liste an, während es im Juni 2017 noch weniger als die Hälfte (203) für die beiden damals noch getrennt firmierenden Unternehmen zusammengenommen waren. Die Spitzenposition haben Nvidia und IBM allerdings aktuell an Fujtsu und Arm und deren Fugaku mit seinen 415 Petaflops verloren, der im Mai am Riken Center for Computational Science im japanischen Kobe installiert wurde.

Der neu vorgestellte PCIe-Formfaktor für den A100 ergänzt die im letzten Monat eingeführten Vier- und Achtwege-Konfigurationen des HGX A100. Die Ergänzung um eine PCIe-Version ermöglicht es Serverherstellern vielfältigere Konfigurationen - von Systemen mit nur einer A100-GPU bis hin zu Servern mit 10 oder mehr Grafikprozessoren.

Last not least übertraf Nvidia den bisherigen Rekord beim Standard-Benchmarks für große Datenanalysen, bekannt als TPCx-BB, um fast den Faktor 19,5x – mit der Datenanalysesoftware Rapids und dem Supercomputer DGX A100. Nvidia schaffe den Benchmark in nur 14,5 Minuten durch, gegenüber dem derzeit führenden Ergebnis von 4,7 Stunden auf einem CPU-System. Die DGX A100-Systeme hatten insgesamt 128 A100-GPUs und nutzten Mellanox-Netzwerke.

Bildquelle: Nvidia