Supercomputer SuperMUC-NG

Wenn Warmwasser die Köpfe kühlt

Der neue Supercomputer des Leibniz-Rechenzentrums (LRZ), ein Institut der ­Bayerischen Akademie der Wissenschaften, soll Maßstäbe bei Rechenleistung und Energieverbrauch setzen. Denn beides gilt als unerlässlich, um ein Rechenzentrum ­effizient zu betreiben – und bedingt sich sogar gegenseitig.

Im Leibniz-Rechenzentrum (LRZ) soll bald der drittschnellste Computer der Welt in Betrieb gehen.

Im Leibniz-Rechenzentrum (LRZ) soll bald der drittschnellste Computer der Welt in Betrieb gehen.

In Garching bei München wird derzeit kräftig gebaut, allerdings für die Öffentlichkeit nicht sichtbar. Im Inneren des Leibniz-Rechenzentrums entsteht „SuperMUC-NG“. Das Kürzel steht für „Next Generation“ und deutet darauf hin, dass hier Europas schnellster Supercomputer entstehen soll. Dies war auch der erste SuperMUC, der 2012 den Wissenschaftlern zur Verfügung gestellt und der 2015 erweitert wurde. Die ersten Maschinen stammten von IBM, wobei der Hersteller sein x86-Geschäft im Jahr 2014 an Lenovo verkaufte. Seitdem ist der Anbieter ein enger Partner des LRZ. Der Prozessorlieferant hat sich ebenfalls nicht geändert: Auch beim neuen Projekt bilden Xeons von Intel die Köpfe der Systeme.

Der Chiphersteller hat sich jedoch bei seiner aktuellen Generation „Xeon Scalable Processor“ (Skylake-SP) etwa Besonderes ausgedacht: Die CPUs können, wie beim Turbo-Boost auf dem Desktop, zur Laufzeit ihren Takt und ihre Leistungsaufnahme verändern. Für einen Supercomputer, der hauptsächlich für die Batch-Verarbeitung von Anwendungen ausgelegt ist und genutzt wird, ist das besonders sinnvoll. Denn so lassen sich der Energiebedarf und die Performance vor dem Start einer Berechnung planen. Lenovo möchte diese Fähigkeiten beim neuen SuperMUC voll ausreizen. Dafür ist u. a. die Software „Energy Aware Runtime“ (EAR), die in einer Kooperation zwischen dem Barcelona Supercomputing Center (BSC) und dem Hersteller entwickelt wurde, im Einsatz, mit der sich je Benutzerjob Takt und Leistungsaufnahme der CPUs im Betrieb variabel anpassen lassen.

Lenovo verwendet im Rahmen des Projekts seine neuen Racks-Mounted-Server des Typs „Think System Dense Optimized Systems SD 650 DWC“ (= Direct Water Cooling). Dabei wird zwischen den „Fat“ und den „Thin Nodes“ unterschieden. Beide Versionen, die auf derselben Think-System-Plattform basieren, besitzen je zwei Sockel für Xeons mit je 24 Kernen. 6.400 Exemplare der dünnen Systeme verfügen über 96  Byte RAM, die dicken Rechner sind mit 768 GByte bestückt. Zusammen soll der gesamte neue Super­rechner eine theoretische Spitzenrechenleistung von mehr als 25 Petaflops (Rpeak) erreichen, was in etwa das Vierfache der Rechenleistung der bisherigen An­lage entspricht. Damit wäre SuperMUC-NG in der aktu­ellen Top-500-Liste der drittschnellste Computer der Welt, Rekordhalter ist Sunway Taihu Light mit 125,4 Petaflops.

Dabei soll SuperMUC-NG viel energieeffizienter als vergleichbare Installationen arbeiten. Die Ingenieure gehen davon aus, dass sie bis zu 40 Prozent weniger Energie im Vergleich zu herkömmlichen Anlagen bei gleicher Rechenleistung benötigen. Möglich macht dies eine Warmwasserkühlung mit einer Vorlauftemperatur von bis zu 45 °C. Bei der herkömmlichen Luftkühlung wird die Abwärme von Prozessoren, Haupt- und Massenspeichern mit Lüftern aus dem Gehäuse geblasen, die Luft dient also als Transportmedium – und die muss durch wiederum energieintensive Klimaanlagen auf Betriebstemperatur gehalten werden. Ein kleiner, aber oft übersehener Faktor sind dabei die zahllosen Ventilatoren selbst, denn sie benötigen ebenfalls Energie und sind störanfällig.

Wasser wird zum Transportmedium


Effizienter ist es, Wasser als Transportmedium zu verwenden: Die Abwärme wird direkt dort aufgenommen, wo sie entsteht, kann gezielt abgeführt und für weitere Zwecke verwendet werden. Genau dies passiert bei dem neuen Superrechner, und zwar mittels einer Adsorptionskältemaschine der Firma Fahrenheit, die eine Ausgründung des Fraunhofer-Instituts ist. Dabei wird eine bestimmte Substanz, das Adsorbens genutzt, um Wasserdampf von einem Wärmetauscher abzuführen. Das Wasser im zweiten Kreislauf verdunstet dabei unter Zufuhr von Wärme – und das erzeugt Kälte.

Im Falle von SuperMUC-NG hat das zwei Vorteile: Zum einen können die Prozessoren mit einer höheren Taktfrequenz betrieben werden, die Rechenleistung steigt also. Zum anderen lässt sich das erzeugte Kaltwasser nutzen, um Storage- und Netzwerkkomponenten zu kühlen, sie müssen bei niedrigeren Temperaturen betrieben werden. Das sind in diesem Fall 21 °C für das Kühlwasser, das aus dem durch die CPUs erwärmten Wasser entsteht, welches dort bei rund 52 °C abgenommen wird. In der Kombination steigt somit für die gesamte Installation die Effizienz, was sich in niedrigeren Energiekosten über die Laufzeit des Systems signifikant bemerkbar macht.

Dies ist ein Artikel aus unserer Print-Ausgabe 05/2018. Bestellen Sie ein kostenfreies Probe-Abo.

Dieses Kühlsystem ermöglicht in Verbindung mit den dicht gepackten Lenovo-Racks überhaupt erst den Ausbau des LRZ auf die benötigte Performance, es ist nämlich kein Neubau des Rechenzentrums nötig. Ein solcher war Anfang der 2000er-Jahre einer der Gründe, warum der Forschungscampus in Garching geplant wurde. Beim bis dahin in der Innenstadt gelegenen LRZ war schlicht kein Platz für Erweiterungen mehr.

Bildquelle: Lenovo

©2018Alle Rechte bei MEDIENHAUS Verlag GmbH

Unsere Website verwendet Cookies, um Ihnen den bestmöglichen Service zu bieten. Durch die weitere Nutzung der Seite stimmen Sie der Verwendung zu. Weitere Infos finden Sie in unserer Datenschutzerklärung.

ok