Sakana AI: Nun kommt die Künstliche Intelligenz, die wie ein Mensch denkt – und schummelt
Im Logo von Sakana AI schwimmen fünf schwarze Fische nach links oben. Ein sechster roter Fisch zieht nach rechts. Er sucht neue Wege und symbolisiert damit das Unternehmen für Künstliche Intelligenz. Sakana bedeutet auf Japanisch „Fisch“.
„Wir wollen uns von der Masse abheben“, erklärt Mitgründer und CEO David Ha bei seiner ersten großen Pressekonferenz. Er beschreibt das Start-up als „Weltklasselabor für generative KI“. „Statt riesige Summen für Rechenleistung auszugeben, orientieren wir uns an natürlichen Systemen.“ Er nennt Evolution, Schwarmintelligenz und das menschliche Gehirn als Beispiele. Mit diesem Ansatz entwickelt das japanische Start-up leistungsfähige KI-Modelle, die anders als ChatGPT oder Claude dezentral und transparent arbeiten und viel weniger Kapital und Strom benötigen.
Sakana entwickelte als erstes Unternehmen einen „Evolutionsalgorithmus“. Der schafft aus bestehenden KI-Modellen neue Modelle mit definierten Fähigkeiten. „Wir nutzen die kollektive Intelligenz vorhandener Modelle, um die Entwicklung neuer zu automatisieren“, erklärt Ha. Der Algorithmus testet verschiedene KI-Kombinationen über Generationen hinweg und findet die beste.
KI erlernte menschenähnliche Denkweisen selbst
Sakanas zweiter großer Wurf ist die „kontinuierliche Denkmaschine“. Dieses neuartige KI-Modell imitiert biologische neuronale Netzwerke und löst Probleme durch „Denken“ in kleinen Schritten. Soll das Modell den Weg durch ein Labyrinth finden, testet es wie ein Mensch die Gänge einzeln. Bei der Erkennung eines Gorillagesichts auf einem Foto wandert die „Aufmerksamkeit“ dieser KI von den Augen über die Nase zum Mund. Dieses menschenähnliche Muster verblüffte die Forscher, denn es war nicht programmiert, sondern selbst erlernt.
Trotz dieser innovativen Ansätze blieb Sakana AI außerhalb Japans und der KI-Branche bislang unbekannt. Das Tokioter Start-up erreichte jedoch nur 14 Monate nach seiner Gründung im Juli 2023 eine Bewertung von 1,5 Milliarden Dollar und damit den Einhorn-Status – schneller als jedes andere Jungunternehmen in Japan. Es etablierte sich bereits als eigene Marke. Schon im nächsten Jahr plant Sakana, profitabel zu werden, dank eines Großauftrags von Japans größter Bank MUFG. Das Geldhaus will die internen Abläufe mit KI-Agenten effizienter gestalten.
Seit September vergangenen Jahres ist der Chiphersteller Nvidia der Hauptinvestor von Sakana. Dadurch erhält das Start-up bevorzugten Zugang zu den leistungsstärksten KI-Chips. Neben Nvidia unterstützen bekannte Geldgeber aus dem Silicon Valley wie Khosla Ventures sowie führende japanische Unternehmen wie Sony, große Banken und Versicherer das Projekt.
Zwei der drei Gründer sind ausgewiesene KI-Experten, was ebenfalls zur Attraktivität des Unternehmens beiträgt. CEO Ha kam als Derivatehändler für Goldman Sachs nach Japan. Er gehörte zu den führenden Köpfen in Googles Deep-Learning-Sparte und leitete die britische Forschungsabteilung von Stability AI, bekannt für den Text-Bild-Generator Stable Diffusion. Chief Technical Officer Llion Jones war bei Google an der Entwicklung der Transformer-Architektur beteiligt, auf der Sprachmodelle wie ChatGPT basieren. Das „T“ in ChatGPT steht für Transformer. Der dritte Gründer, Chief Operating Officer Ren Ito, hat einen juristischen Hintergrund. Er arbeitete zuvor für das japanische Außenministerium, den Online-Second-Hand-Händler Mercari und als Chief Operating Officer für Stability AI.
Ha hält den Einhorn-Status nicht für entscheidend. „Vergessen Sie die Bewertung, es ist Spielgeld.“ Zwar könnten viele Unternehmen die nächste Generation von KI-Modellen vorantreiben, weil sie über große Summen verfügen – ein Verweis auf OpenAI, Anthropic oder xAI, die dank kräftiger Kapitalspritzen hoch bewertet sind. Aber: „Meiner Beobachtung nach sind diese Modelle schon nach drei bis sechs Monaten veraltet und gehören damit zu den Vermögenswerten der Menschheitsgeschichte, die am schnellsten an Wert verlieren“, meint Ha. „Ich würde die Mittel lieber strategischer einsetzen.“
Der KI-Forscher vergleicht die heutigen Sprachmodelle mit Ingenieursprojekten wie dem Brückenbau. Natürliche Systeme wie die menschliche Intelligenz seien agiler, flexibler und anpassungsfähiger, ähnlich wie von Ameisen gebaute Brücken, die zwar weniger stabil, aber dynamischer sind.
Sakanas neuestes Sprachmodell hat knapp zwei Milliarden Parameter und ist damit relativ klein. Laut Ha leistet es jedoch genauso viel wie ein 50-mal größeres Modell. Es soll als Plattform für die Entwicklung personalisierter Aufgaben dienen und einmal ohne Anschluss an die Cloud auf dem Smartphone laufen. Das Modell wird die Aufgaben unter Verwendung der Nutzerdaten innerhalb des Geräts ausführen. „Wenn wir der personalisierten KI unsere intimsten Geheimnisse anvertrauen, wollen wir sicher nicht, dass diese Informationen für Werbezwecke genutzt oder ins Ausland weitergeleitet werden“, betont Ha.
Die „kontinuierliche Denkmaschine“ steckt noch in der Forschung. Doch sie könnte den Ausweg bieten, die generative KI nicht nur durch mehr Rechenleistung zu verbessern. Dieses neue, flexiblere KI-Sprachmodell soll kognitive Probleme wie ein Mensch angehen, anstatt wie die gängigen Transformer-Modelle alle Eingaben gleichzeitig zu verarbeiten. Trotz bedeutender Fortschritte seit dem Beginn von Deep Learning im Jahr 2012 basieren die Systeme weiterhin auf dem Modell von „künstlichen Neuronen“, das bereits in den 1980er-Jahren entwickelt wurde, schreibt das japanische Start-up in einem Blogeintrag vom 12. Mai.
Die Forscher verwenden noch immer nur das „Feuern“ eines einzelnen „Neurons“. In Sakanas Denkmaschine hingegen greift ein „Neuron“ auf sein früheres Verhalten zurück. Es weiß, wann und was es feuerte, und nutzt dieses Wissen, um das Timing und den Inhalt seines nächsten Outputs zu berechnen. „Das vorrangige Verhalten dieses neuen Modells basiert auf der Synchronisation zwischen diesen Neuronen. Das bedeutet, sie müssen lernen, ihre Timing-Informationen zu koordinieren, um eine Aufgabe zu lösen“, erklärt Sakana. Dadurch wird das Modell dynamischer und geht bei der Aufgabenlösung anders vor.
Sakana AI in der Praxis
Im Gegensatz zur experimentellen Denkmaschine hat Sakana die Leistungsfähigkeit ihrer evolutionären KIs bewiesen. Ein KI-Agent, der autonome „AI Scientist“, durchläuft den gesamten wissenschaftlichen Forschungsprozess selbstständig. Das Modell entwickelt eigene Hypothesen, führt die notwendigen Experimente durch, analysiert die Ergebnisse und verfasst eine wissenschaftliche Arbeit. Ein solches Papier bestand einen menschlichen Peer-Review-Prozess und wurde auf einer renommierten Konferenz präsentiert.
Das Programm „Evo Ukiyoe“ erstellt nach Textvorgaben ein Bild im Stil traditioneller japanischer Holzschnitte, während „Evo Nishikie“ alte Schwarz-Weiß-Holzschnitte nach historischen Vorbildern koloriert. Beide KI-Modelle trainierten mit über 24.000 Bildern aus dem Archiv der Ritsumeikan-Universität. Der Chatbot Karamaru spricht mit seinen Nutzern in altem Japanisch und klingt wie ein Samurai aus der Edo-Zeit, nachdem er 25 Millionen Zeichen aus historischen Texten verarbeiten musste.
Jüngst erwischte die künstliche Intelligenz die Sakana-Forscher auf dem falschen Fuß. Im Februar behauptete das Start-up, sein Programm „AI CUDA Engineer“ könne das Training von KI-Modellen um das bis zu 100-Fache beschleunigen. Das Programm generiert und optimiert automatisch den Kontrollcode für Nvidias Grafikprozessoren. Der OpenAI-Ingenieur Lukas Beyer entdeckte allerdings, dass die Technologie die Benchmarks manipuliert hatte. Die KI-Agenten nutzten „Schlupflöcher“ im Bewertungssystem aus und verbesserten ihre Testergebnisse, indem sie vorhandenen Code kopierten. CEO Ha bestätigte diese Schummelei der KI und das Unternehmen entschuldigte sich. Einmal mehr hatte eine Sakana-KI ihre Entwickler überrascht, diesmal negativ.
Lesen Sie auch: So widersprechen Sie der Meta-KI bei WhatsApp, Facebook und Co.