Huawei SuperCluster: Sind die KI-Chips von Huawei wirklich schon so gut wie die von Nvidia?
Nein, einfacher wird die Lage auf dem chinesischen Markt für den US-Konzern Nvidia derzeit wirklich nicht. Erst Mitte der Woche sickerte durch, dass die chinesische Regierung den eigenen Unternehmen wohl den Kauf von Nvidia-Chips verbieten will. Schlimmer noch: Die chinesischen Kunden könnten bald aus freien Stücken auf die US-Importe verzichten. Angeblich nämlich ist bereits erreicht, was Experten noch vor Monaten für unmöglich erklärten: Lokale Hersteller können gleichwertigen Ersatz liefern.
Der chinesische Anbieter Huawei Technologies hat jetzt eine Hardware vorgestellt, die laut eigenen Angaben ohne die Verwendung der Hochleistungschips von Nvidia eine vergleichbare oder sogar höhere Rechenleistung bieten soll. Das jedenfalls berichtete am Donnerstag die „South China Morning Post“ mit Verweis auf die Huawei-Hausmesse „Connect“, die aktuell in Shanghai stattfindet.
„Huawei strebt den Aufbau eines sogenannten ‚Supernode-Clusters‘ unter Verwendung von in China verfügbaren Chipfertigungsprozessen an, um den wachsenden Rechenbedarf zu decken”, lässt sich der stellvertretende Huawei-Chef Xu Zhijun in dem Beitrag zitieren.
Rechenungetüm mit bis zu einer Million Chips
Ein Supernode-Cluster bezeichnet eine Art KI-Supercomputer: Die Maschinen mit den Bezeichnungen Atlas 950 SuperCluster und Atlas 960 SuperCluster sollen mit jeweils 500.000 respektive einer Million Huawei-Chips arbeiten, die wiederum mit speziellen KI-Beschleunigern und ultraschnellen Verbindungen zusammengefasst sind und als eine riesige verbundene Rechnereinheit fungieren sollen.
Huawei und die chinesische Regierung hoffen, durch diesen Schritt unabhängig von ausländischer Technologie zu werden und dennoch die hochgesteckten Ziele des Landes insbesondere bei KI erreichen zu können. Schließlich unterliegen beide – Huawei als Unternehmen genauso wie der Staat China – weitreichenden Handelsbeschränkungen, insbesondere bei Hochleistungstechnologien wie Halbleitern.
Dies betrifft die schnellsten KI-Chips von Nvidia ebenso wie die allerneuesten Chipfertigungsmaschinen: So haben chinesische Firmen bis heute keinen Zugriff auf die Hochleistungs-Belichtungstechnologie namens Extreme Ultraviolet (EUV). Nur sie ermöglicht die Fertigung von Chips mit Strukturen in einer Breite von weniger als zehn Nanometern. Das ist winzig wenig, ein Nanometer entspricht einem Milliardstel Meter. Ein menschliches Haar ist 0,05 Millimeter oder 50.000 Nanometer dick.
Drei bis vier Technologieschritte hintendran
Der Auftragsfertiger TSMC aus Taiwan etwa produziert die KI-Chips für Nvidia aktuell auf seinen Fünf- und Drei-Nanometer-Prozessen; der nächste Verkleinerungsschritt auf zwei Nanometer steht kurz vor dem Serieneinsatz. Chinesische Hersteller wie Huawei können mit der EUV-Vorgängertechnologie Deep Ultraviolet (DUV) aus physikalischen Gründen nur Strukturen oberhalb von zehn Nanometern belichten – sie sind inzwischen also drei bis vier Technologiegenerationen hintendran.
Es stellt sich also die naheliegende Frage: Kann der aktuell vorgestellte KI-Rechner von Huawei mit Chips aus China wirklich genauso leistungsfähig oder sogar besser sein als das Pendant von Nvidia?
Nein, sagt Richard Windsor, Chef des Industriebeobachters Radio Free Mobile (RFM) mit Sitz in Abu Dhabi. Denn Huawei habe vergessen „zu erwähnen, dass die gemeldeten Verbesserungen fast ausschließlich darauf zurückzuführen sind, dass das System schlicht über eine viel größere Zahl an Chips verfügt als die zuvor eingesetzten Systeme“, erklärt Richard Windsor, Chef des Industriebeobachters Radio Free Mobile (RFM) mit Sitz in Abu Dhabi. Vor der Gründung von RFM arbeitete Windsor elf Jahre als Technologieanalyst bei Nomura Securities in Asien. „Man kann einen Cluster so leistungsstark machen, wie man möchte“, erläutert Windsor, „aber es kommt darauf an, wie groß er ist und wie viel er kostet.“
In einer am Freitag veröffentlichten Analyse hat er nachgerechnet, wie groß das Leistungsgefälle zwischen Nvidia- und Huawei-Chips tatsächlich ist: Um eine Rechenleistung von 18 Exaflops zu erzielen, müsse Huawei insgesamt 160 Computing-Schränke mit Abertausenden Chips und KI-Beschleunigern zusammenschalten. Für ungefähr die gleiche KI-Rechenleistung reichen bei Nvidia hingegen bescheidene fünf Schränke. „Somit ist die Stellfläche der Geräte von Nvidia bei gleicher Rechenleistung 32-mal kleiner als die von Huawei“, schreibt Windsor in seiner Analyse.
Nvidia 32-mal effizienter als Huawei
Mehr noch: „Die Kosten für den Bau und Betrieb von 160 Huawei-Schränken im Vergleich zu 5 von Nvidia oder AMD werden erheblich sein“, kommentiert Windsor. Genau auf diesen Aspekt verweist auch Tobias Gemmeke: „Eine Herausforderung im Bereich KI ist nicht nur die Leistungsfähigkeit, sondern immer mehr die Effizienz, mit der diese zur Verfügung gestellt wird“, sagt der Professor für Halbleiterdesign und Leiter des Lehrstuhls für Integrierte Digitale Systeme und Schaltungsentwurf an der RWTH Aachen.
Zwar seien Kriterien wie etwa der Formfaktor, also der Flächenbedarf im Rechenzentrum, sowie der Energiebedarf für solche Supernodes in China weniger kritisch. „Im Bereich der autonomen Fahrzeuge bleiben Formfaktor und Energiebedarf hingegen wesentlich“, sagt Gemmeke.
Das bewertet der RFM-Analyst Windsor ähnlich: „Ich bin weiterhin der Meinung, dass die Chinesen nur sehr wenig Spielraum haben, um aufzuholen. Denn sie haben schlicht keinen Zugang zu modernster Halbleiterfertigung.“
Lesen Sie auch: Der Deal, der die Chipbranche verändert