Mit Power10 will IBM die externen Schnittstellen Poweraxon 2.0 und „Open Memory Interface“ (OMI) auf eine Bandbreite bis zu 1 Terabyte/s beschleunigen und PCI Express 5.0 integrieren. Offenbar wird PCIe 5.0 in den Ende 2021 erwarteten Power10-Systemen auch zur CPU/GPU-Kopplung genutzt. Nach IBM-Angaben hat NVLink dann ausgedient.

Poweraxon 2.0, der Nachfolger der mit Power9 eingeführten Speicher-Schnittstelle, kann Numa- oder Open-CAPI-Protokolle ausführen. Es gibt keinen guten Grund, warum damit nicht auch das NVLink-3.0-Protokoll ausgeführt werden könnte, das bei den Nvidia A100-GPU-Beschleunigern verwendet wird – aber das wurde noch nicht angekündigt. Die Frage ist: Warum nicht? Immerhin ist Nvidia doch ein langjähriger Partner und Gründungsmitglied der Open Power Foundation.

Das wirft Fragen auf, zum Beispiel: Will IBM die Workloads künftig primär mit den eigenen CPUs bewältigen? Oder favorisiert Nvidia künftig den neuen CPU-Partner ARM? Steht das „N“ im Akronym nicht mehr für NVLink, sondern für Numa? Auffällig war ja schon bei der Ankündigung der Nvidia-GPU A100 im Frühjahr, dass praktisch alle wichtigen Serverhersteller Unterstützung signalisierten – nur IBM nicht.

Schluss mit Spekulationen

Die Antwort der IBM auf die Frage nach NVLink 3.0 klingt plausibel und nimmt vielen Spekulationen den Wind aus dem Segel: „Ursprünglich haben IBM und Nvidia bei der Entwicklung der Host-zu-GPU Attachment-Technologie NVLink zusammengearbeitet, um Leistungsengpässe zu überwinden, die durch die unzureichenden Fähigkeiten von PCIe Gen3 verursacht werden. Während dies eine erhebliche Differenzierung gegenüber PCIe Gen3 und Gen4 ermöglichte, beschleunigte die Industrie das Tempo der PCIe-Entwicklung. Mit dem Aufkommen von PCIe Gen5 stellten sowohl IBM als auch Nvidia fest, dass PCIe nun wieder ausreichend ist, um Leistungsengpässe beim Host-zu-GPU-Attach zu beseitigen. Daher ist eine proprietäre Lösung wie NVLink nicht länger ein starkes Unterscheidungsmerkmal für den Host-zu-GPU-Attach – und deshalb nutzt der Power10-Prozessor NVLink nicht für den Host-zu-GPU-Attach aus.“ Übrigens bietet Nvidia die neue A100-GPU auch im PCIe-Formfaktor an.

Allerdings ist es nach IBM-Einschätzung nun die Speicher-zu-Host-Bandbreite, die der Direktanschluss von Standard-DDR-DRAM bietet, die zum neuen Engpass auf Systemebene geworden ist. Um diesen Engpass zu überwinden, habe man die offene Speicherschnittstelle „OMI“ als Alternative mit hoher Bandbreite entwickelt.

Völlig neu bei Power10 ist die Funktion „Memory Inception“, mit der ein Power10-Server via Poweraxon-Verbindung auf RAM zugreifen kann, das in einem anderen Power10-Server (oder mehreren) steckt. Das funktioniert nicht wie bei Remote DMA via Infiniband, sondern der Speicher ist genauso nutzbar, als wäre er physisch präsent. Das heißt: Mit der neuen CPU wird es möglich, den Speicher aller Power10-Server in einem Rechenzentrum linear zu adressieren. Man muss dafür also nicht länger auf umständliche Hilfsmittel wie das „Message Passing Interface“ (MPI) zurückgreifen, sondern kann diesen Speicher im fremden Server ganz normal über seine Adresse ansprechen – und zwar in einem virtuellen Adressraum mit bis zu 2 Petabyte.

