ChatGPT-Konkurrenz aus China: Ist DeepSeek nur ein Bluff?
ChatGPT wurde mit Millionen von Dokumenten aus dem Internet trainiert – Wikipedia-Einträge, Webseiten, wissenschaftliche Studien sowie Artikel aus klassischen Medien. Die „New York Times“ hat wegen letzterem eine Urheberrechtsklage eingereicht. Sie wirft OpenAI und dessen Kooperationspartner Microsoft vor, Artikel der „Times“ unerlaubt verwendet zu haben. Der Ausgang ist offen, die Klage läuft noch.
OpenAI hat die Vorwürfe zurückgewiesen. In der KI-Branche geht man jedoch davon aus, dass tatsächlich „New York Times“-Artikel verwendet wurden. Es wird allerdings schwer sein, einen Urheberrechtsbruch gerichtsfest nachzuweisen. Sorgt nun Karma für Gerechtigkeit?
Glaubt man dem auf das Entdecken von Plagiarismus spezialisierten US-Start-up Copyleaks, dann ist OpenAI nun selbst Opfer eines groß angelegten Datendiebstahls geworden. Die von Copyleaks entwickelte KI-Textanalyseplattform hat das Modell R-1 des chinesischen OpenAI-Herausforderers DeepSeek unter die Lupe genommen. Über ein sogenanntes Jury-System wurden dabei von KI erzeugte Texte von drei Klassifikatoren geprüft, die auf Merkmale wie Satzstruktur, Vokabular und Phrasierung untersuchen, also eine Art stilistischer Fingerabdruck. Alle drei Klassifikatoren müssen bei ihrem Urteil übereinstimmen.
Das Ergebnis: Sagenhafte 74,2 Prozent der von DeepSeek R-1 generierten Texte stimmten mit stilistischen Fingerabdrücken von OpenAI überein. Im Gegensatz dazu war das beim Phi-4 Sprachmodell von Microsoft nur in 0,7 Prozent der Inhalte der Fall.
Shai Nisan, Chef-Datenwissenschaftler von Copyleaks behauptet, dass dank des Jurysystems eine Präzisionsrate von 99,8 Prozent erreicht wird. Copyleaks ist mit seinen Werkzeugen auch in der Lage, verschiedene KI-Modelle wie ChatGPT, Llama, Claude und Gemini zu erkennen. Nisan scheut sich dennoch, DeepSeek offen des Diebstahls zu bezichtigen. „Es wirft Fragen auf“, sagt. Und doch: Seine Ergebnisse machen es schwer, zu einem anderen Schluss zu kommen.
Wenn DeepSeek kräftig abgekupfert haben sollte, stellt das jedoch eine Annahme in Frage, die den KI-Markt kräftig aus den Angeln gehoben hat. Denn die Urheber von R-1 behaupten, ihr Modell mit wesentlich weniger Aufwand als OpenAI trainiert zu haben. Nach Bekanntgabe verlor der KI-Hardware-Ausrüster Nvidia fast 600 Milliarden Dollar an Börsenwert an nur einem Tag – ein Rekord. Auch die Aktien von US-Stromerzeugern wie Constellation und Vistra, die ein Boom-Geschäft beim Versorgen von Rechenzentren mit Energie wittern, verloren deutlich an Wert.
DeepSeek-Gründer als Volksheld
In San Francisco und dem Silicon Valley fühlte man sich überrumpelt, galt man doch wegen einer einzigartigen Mischung aus Talenten, Wagniskapital und machtvollen Allianzen mit Tech-Größen als Epizentrum der KI-Entwicklung.
In China gilt derweil Liang Wenfeng, der Gründer von DeepSeek, als Volksheld. Präsident Xi Jinping schüttelte ihm bei einem Treffen mit Tech-Größen seines Landes öffentlichkeitswirksam die Hand. Gelang dem Mathe-Genie und Hedgefonds-Spekulanten doch das Kunststück, die Wettbewerber aus Amerika herauszufordern, trotz Exportkontrollen für KI-Hardware: Talent schlägt das große Geld. „Deepseek R1 ist eine der erstaunlichsten und beeindruckendsten Errungenschaften, die ich je gesehen habe“, jubelte Internet Pionier und Wagniskapitalgeber Marc Andreessen.
Doch schnell wurden Vorwürfe laut, dass die Chinesen getrickst hätten. Alexandr Wang, CEO von Scale AI, behauptete, dass DeepSeek in Wirklichkeit Zugriff auf 50.000 KI-Beschleuniger von Nvidia gehabt habe. „Sie können nur wegen den Exportkontrollen nicht darüber reden“, so Wang, der allerdings keine Belege dafür vorlegte.
Hat es sich DeepSeek sogar noch einfacher gemacht? Ein Indiz ist, dass Sicherheitsexperten von Microsoft im Herbst vergangenen Jahres den Abfluss von großen Datenmengen über eine Schnittstelle von OpenAI registrierten.
Ein einziger Bluff aber ist DeepSeek nicht, selbst wenn die Vorwürfe zutreffen sollten. Denn mit seinem „Mixture of Experts“-Ansatz ist das Modell bei spezifischen Aufgaben effizienter als das derzeitige von ChatGPT, überflügelt es sogar in Bereichen wie Logik und Programmierung.
Statt wie ChatGPT bei jeder Anfrage das gesamte Modell heranzuziehen, wählt DeepSeek nur den Teil aus, der darauf spezialisiert ist.
Klar ist: DeepSeek hat das Rennen um KI neu befeuert – und die Rolle Chinas dabei. Nun müssen seine Schöpfer in der nächsten Runde beweisen, dass es sich um mehr als ein gut optimiertes Modell handelt – mit möglicherweise unfairem Startvorteil.
Lesen Sie auch: Warum DeepSeek jetzt Europa ins KI-Rennen zurückbringen könnte