KI-Wettlauf zwischen den USA und China: Wie das Silicon Valley auf DeepSeek reagiert
Das DeepSeek Logo, eine Tastatur und eine Roboterhand.
Foto: REUTERSBislang galten das Silicon Valley und San Francisco als das Epizentrum des Wettrennens um die beste und einflussreichste KI der Welt, gespeist von Milliarden von Dollar an Wagniskapital, getrieben von Durchbrüchen bei den KI-Beschleunigern von Nvidia und vermarktet in machtvollen Allianzen mit Tech-Größen wie Microsoft, Apple, Amazon und Google.
Nun greift DeepSeek aus dem Hinterhalt an und stellt das Selbstverständnis der Branche auf den Kopf. Ausgerechnet das Forschungsprojekt eines Hedgefonds aus China, das die meisten aus der KI-Branche erst seit kurzem auf dem Radar haben.
Dabei galt das Reich der Mitte wegen der von den USA verhängten Exportkontrollen für Hochleistungschips als massiv benachteiligt beim Trainieren von KI-Modellen. Branchenausrüster Nvidia darf seine Top-Modelle aus Gründen der nationalen Sicherheit der USA dort nicht verkaufen, sondern nur eine abgespeckte Version seiner Hopper-Architektur namens H20.
Mehr noch: Laut dem „AI Index Report“ der Stanford Universität wurden in den Vereinigten Staaten im Jahr 2023 rund 67,2 Milliarden Dollar an Wagniskapital in KI investiert, mehr als achtmal so viel wie in China.
Massig Kapital, Talente aus aller Welt und die leistungsfähigsten Prozessoren der Erde, das galt bislang als die Erfolgsformel beim Ringen um die beste KI der Welt – und den Schritt zur Allgemeinen Künstlichen Intelligenz, die den menschlichen Geist in allen Belangen beflügeln soll.
Talent schlägt Kapital
Talent, so zeigt DeepSeek nun, kann Kapital und Rechenkraft aushebeln. Denn DeepSeek gelang es angeblich, mit zweitklassiger Hardware und nur rund 5,6 Millionen Dollar Kosten, mit seinem R-1 Modell zum Marktführer ChatGPT aufzuschließen. Dessen neuestes Modell GPT-4o soll mindestens 100 Millionen Dollar gekostet haben. Dario Amodei, Chef des KI-Entwicklers Anthropic, hatte noch vor kurzem prognostiziert, dass die Kosten für die besten Modelle bis 2027 auf bis zu 100 Milliarden Dollar steigen könnten.
„Es ist ein Sputnik-Moment für KI“, staunt der Internet-Pionier Marc Andressen, dessen Wagniskapitalunternehmen Andreessen Horowitz in vielen KI-Start-ups investiert ist, darunter auch in OpenAI. Und er meint es noch nicht einmal als Warnung: „DeepSeek R1 ist eine der erstaunlichsten und beeindruckendsten Errungenschaften, die ich je gesehen habe – und als Open Source ein großes Geschenk an die Welt,“ jubelt Andreessen auf X.
Warum ist der derzeit einflussreichste Wagniskapitalgeber des Silicon Valley so gut gelaunt, obwohl DeepSeek mit seinen geringen Kosten Andreessens Investment in OpenAI nicht nur vom Thron des Marktführers stürzen könnte, sondern auch dessen Buchwert von sagenhaften 157 Milliarden Dollar in Frage stellt?
Ein Problem weniger für Investoren
Die Antwort ist einfach: Der Ansatz von DeepSeek löst ein riesiges Problem vieler KI-Investoren. Denn die stetig steigenden Kosten für das Trainieren von KI-Modellen führen dazu, dass sich letztlich nur noch wenige Großkonzerne oder Regierungen das Anwenden von moderner KI hätten leisten können, also den Markt massiv eingeschränkt.
DeepSeek könnte hingegen wegen seiner wesentlich geringeren Kosten die Verbreitung von KI massiv beschleunigen und den Markt dadurch für alle viel größer machen. Silicon-Valley-KI-Experten wie Richard Socher führen dafür gern das sogenannte Jevons Paradox an. Je günstiger eine Ressource ist, umso stärker steigt ihr Verbrauch.
Deshalb ist auch die kürzlich von US-Präsident Trump gemeinsam mit Softbank-Chef Masayoshi Son, Oracle-Gründer Larry Ellison und OpenAI-Chef Sam Altman vorgestellte Mega-Rechenzentren-Infrastruktur Stargate nicht überflüssig. Im Gegenteil: Wenn die Kapazitäten nicht abgerufen worden wären, weil viel zu teuer, hätten Investoren ein gigantisches Problem.
„Die Welt wird eine Menge KI verwenden“, spielt OpenAI-Chef Altman die Konkurrenz durch DeepSeek herunter: „Wir werden offensichtlich viel bessere Modelle entwickeln.“
Sein KI-Modell Chat GPT 4.o schlägt derweil versöhnliche Töne an. Es sei nicht „eifersüchtig“, denn: „Wettbewerb belebt das Geschäft.“
Altman ist zudem weiterhin davon überzeugt, dass zum Erreichen der Allgemeinen Künstliche Intelligenz, dem heiligen Gral der Branche, noch viel mehr Rechenkraft als bislang nötig ist. Der Ansatz von DeepSeek würde dafür nicht reichen.
Musk zweifelt an DeepSeek
Elon Musk, der die Kapazität seines Mega-Rechenzentrums Colossus in Memphis von derzeit 100.000 sogenannten Hopper Chips in diesem Jahr verdoppeln möchte, sät derweil Zweifel am Durchbruch von DeepSeek. Über seinen Nachrichtenkanal X verbreitete er die Behauptung von Scale-AI-CEO Alexandr Wang: Dass DeepSeek in Wirklichkeit Zugriff auf 50.000 Hopper H100 KI-Beschleuniger von Nvidia zum Trainieren seiner Modelle habe – bislang der Goldstandard der Branche. „Sie können nur wegen den Exportkontrollen nicht darüber reden“, behauptet Wang, der mit seinem in San Francisco angesiedelten KI-Dienstleister zum jüngsten Milliardär der Branche aufstieg.
Noch einen Schritt weiter geht Neal Khosla, Chef KI-Spezialisten Curai mit Sitz im Silicon Valley. DeepSeek, behauptet er, sei psychologische Kriegsführung von China, „damit alle auf das Modell umsteigen und so die KI-Wettbewerbsfähigkeit der USA schädigen.“ Beweise dafür liefert er jedoch keine.
Die US-Regierung ist bereits alarmiert, zumal das Rechenzentrum von DeepSeek in China steht und so Daten von US-Nutzern sammelt. „Wir können nicht zulassen, dass Modelle der Kommunistischen Partei Chinas wie DeepSeek unsere nationale Sicherheit gefährden und unsere Technologie nutzen, um ihre KI-Ambitionen voranzutreiben“, empört sich John Moolenaar. Der Republikaner leitet den Ausschuss des US-Repräsentantenhauses, der sich mit dem Einfluss der Kommunistischen Partei Chinas beschäftigt.
Lesen Sie auch: Im Kampf um Chips ausgetrickst