Entwicklerkonferenz I/O: So will Sundar Pichai Googles Kronjuwel retten
Sundar Pichai
Foto: APSundar Pichai schaut ernst, als er am Mittwochvormittag kalifornischer Zeit in grauer Häkel-Strickjacke und Jeans auf die Bühne tritt, die in einem Park hinter dem Google-Hauptquartier aufgebaut ist. Der gebürtige Inder ist seit August 2015 Chef des einflussreichen Silicon-Valley-Konzerns. Es ist bereits die siebte Entwicklerkonferenz unter seiner Ägide, die er nun eröffnen wird. Es ist wahrscheinlich auch die bislang bedeutendste für Pichai. Denn die Zeiten haben sich geändert. Es gärt im Googleplex und zwar ausgerechnet zum 25. Geburtstag.
Es ist zwar nicht das erste Mal unter seiner Ägide, dass es Unruhe bei Google gibt. Früher protestierten Mitarbeiter gegen Pläne, eine zensierbare Suchmaschine für China zu entwickeln oder gegen eine engere Zusammenarbeit mit dem US-Militär.
Aber das ist nicht vergleichbar mit der gegenwärtigen Situation. Während der Pandemie hatte Pichai zehntausende Mitarbeiter anheuern lassen. Viel zu viele, wie sich herausstellte. Deshalb musste er im Januar 12.000 Mitarbeiter entlassen. Es waren die ersten Massenentlassungen in der Geschichte Googles. Nicht nur frisch angeworbene Googler traf es, auch gestandene Ingenieure, die sich in einem Job auf Lebenszeit wähnten.
Das väterliche Image von Google als fürsorgender Arbeitgeber ist seitdem dahin. Auch die Entlohnung von Pichai sorgt für schlechte Stimmung. Der Google-Chef wurde schon immer fürstlich bezahlt, selbst für US-Maßstäbe. Im vergangenen Jahr – auch wegen fällig gewordenen Aktienoptionen – immense 226 Millionen Dollar. Aber diesmal nehmen ihm das einige Mitarbeiter krumm. Dass zum ersten Mal Pichais Position in Gefahr ist, wie im Silicon Valley unter Wagniskapitalgebern kolportiert wird, liegt an etwas anderem.
Google hat sich in der öffentlichen Wahrnehmung die Führungsrolle für Künstliche Intelligenz vor einem noch vor Monaten weithin unbekannten Start-up namens OpenAI abnehmen lassen. Mit seinem Textgenerator ChatGPT verzaubert es seit November die Massen und das Silicon Valley. Dabei ist Google ein Pionier bei maschineller Intelligenz, hat viele der von OpenAI genutzten Technologien wie sogenannte Transformer auf den Weg gebracht.
Lesen Sie auch: OpenAI – diese Firma steckt hinter dem KI-Hype ChatGPT
Doch Pichai zögerte, den einstigen Vorsprung konsequent auszunutzen. Nicht nur wegen der Gefahren, die in einer außer Kontrolle geratenen maschinellen Intelligenz stecken, die Falschnachrichten erfindet oder Stimmen täuschend echt nachahmt.
Der Google-Chef versucht, die Deutungshoheit zurückzugewinnen
Sondern auch, weil sie drohte, Googles mit Abstand wichtigste Profitquelle – seine Suchmaschine – zu erschüttern. Und mit ihr ein bis dahin – zumindest für Google gut laufendes – Ökosystem aus Urhebern von Inhalten, Anzeigenkunden und Vermarktern. Einige der Google-Talente für maschinelle Intelligenz wanderten wegen dem gemächlichen Tempo zu OpenAI ab. All das wäre zu verschmerzen, hätte OpenAI-Chef Sam Altman nicht einen reichen Partner namens Microsoft für sich gewonnen.
Der einflussreichste Softwarekonzern der Welt will bis zu elf Milliarden Dollar in die Allianz stecken und dabei, so Microsoft-Chef Nadella, „Gorillas tanzen lassen.“ Mit Gorilla meint er Google. Und nicht nur dessen Suchmaschine angreifen, wo Microsoft mit Bing nur magere drei Prozent Weltmarktanteil hält. Sondern mit Hilfe von KI auch gleich Google Office und Google Cloud in die Schranken weisen, gefährliche Wettbewerber von Microsoft Office 365 und Azure. Die Gefahr ist so ernst, dass die Google-Gründer Larry Page und Sergey Brin aus ihrem Ruhestand zurückkehrt sein sollen, um kraft ihrer Prominenz hinter den Kulissen Entwickler motivieren.
Pichai braucht also einen Befreiungsschlag. Nicht nur intern, sondern vor allem in der öffentlichen Wahrnehmung. Auf der Bühne versuchte er am Mittwoch die Deutungshoheit zurückzugewinnen. „Wie ihr vielleicht gehört habt, hatte KI ein sehr geschäftiges Jahr“, scherzte er. Um dann daran zu erinnern, dass er Google schon 2017 zur „AI first company“ erklärt habe, wo also Künstliche Intelligenz an erster Stelle steht.
Vielleicht nicht immer nach außen sichtbar, aber auf alle Fälle hinter den Kulissen, etwa mit selbst entwickelten Prozessoren für Künstliche Intelligenz. „Unser Ziel ist es, Künstliche Intelligenz für jedermann hilfreich zu machen“, gibt er die Marschrichtung vor. Dies, schiebt er später hinterher, müsse jedoch „verantwortungsvoll geschehen.“ Mit anderen Worten: Trotz allem Druck will sich Pichai nicht hetzen lassen.
Das erste Produkt für Konsumenten, das mittels Künstlicher Intelligenz neu definiert wurde, war 2015 Google Photos. Seitdem können seine Nutzer munter Photos manipulieren, allerdings nicht auf dem Niveau professioneller Bildbearbeitungsprogramme wie Adobe Photoshop. Das soll sich nun ändern. Nach dem „magischen Radiergummi“ mit dem sich die Szenerie störende Menschen oder Objekte löschen lassen, soll nun bald mit einem „magischen Editor“ das ganze Foto aufgewertet werden können, inklusive Gegenständen, die sich gar nicht im Original befanden.
Auch die Funktion von Google, mit der sich automatisch Antworten auf E-Mails verfassen lassen, wird von simplen Phrasen wie „großartig, danke“, mit Hilfe von Künstlicher Intelligenz zu einer wie von einem menschlichen Gegenüber verfassten Erwiderung aufgepeppt. Zudem werden die Google-Bürosoftwareprogramme wie Google Docs und Sheet mit einer „Duet AI“ verstärkt, die Texte generieren, aus Dokumenten Zusammenfassungen erzeugen und alles in eine Präsentation packen kann, inklusive künstlich erzeugter Illustrationen oder Fotos. Selbst wenn man seine Folien fertig hat, aber keinen Text für den Vortrag, kann die maschinelle Intelligenz helfen. Es ähnelt dem, was Microsoft derzeit mit seinem Microsoft Office 365 Copilot mit Unternehmen testet.
Statt LaMDA nun PaLM2 und DuetAI
Möglich wird all das durch ein neues Sprachmodell namens PaLM 2, das mit über 100 menschlichen und 20 Programmiersprachen trainiert wurde und sie beherrscht. Es löst Googles bisheriges Modell namens LaMDA ab.
Genauer ist es eine ganze Familie von Modellen, von denen die größte namens Unicorn für Rechenzentren vorgesehen ist. Und die kleinste namens Gecko für Smartphones zugeschnitten ist und auch ohne Internet-Verbindung funktioniert. Man kann also Antworten auch auf seinem Handy formulieren lassen, was nicht nur unterwegs praktisch ist. PaLM 2 ist zudem in der Lage, zu erläutern, wie es zu bestimmten Schlussfolgerungen kommt, ist also keine Blackbox.
PaLM 2 soll auch Google Bard mehr Intelligenz einhauchen. Das ist auch dringend nötig. Googles Antwort auf OpenAIs Chatbot ChatGPT wurde eilig im Februar gestartet und hat bis heute im Vergleich nicht überzeugen können. Was auch daran liegt, dass OpenAI seinem Bot wesentlich mehr Freiraum gegeben hat. So kann er beispielsweise mit vielen Sprachen umgehen und Antworten in ihnen verfassen.
Das beeindruckt, auch wenn ChatGPT mitunter „halluziniert“, also Antworten einfach erfindet, ohne Rücksicht auf ihren Wahrheitsgehalt. Bard ist dagegen derzeit nur auf Englisch freigegeben und viel konservativer bei seinen Antworten. Das soll sich nun zumindest bei den Sprachen ändern. Bard ist ab sofort auch auf Koreanisch und Japanisch verfügbar. 40 andere Sprachen sollen folgen, darunter auch Deutsch. Dass Google dort zögert, enttäuscht.
Googles Manager fühlen sich zumindest so sicher, dass sie Bard nun weltweit freigeben, in 180 Ländern. Allerdings vorerst nicht in Deutschland. Milliarden Nutzer können nun Googles ChatBot testen und selbst ein Urteil fällen. Wie bei ChatGPT soll die Verbreitung durch Schnittstellen gefördert werden, an der Partner andocken können. Einer der ersten ist der Softwarekonzern Adobe. Weitere sind die Reisesuchmaschine Kayak und der Restaurant-Reservierer OpenTable. Nutzer können zudem die erzeugten Inhalte einfach exportieren.
Aber was mit Googles Kronjuwel, seiner Suchmaschine? Hier wagt sich Pichai tatsächlich vor. Zum ersten Mal seit langem wird die bewährte Suchmaske verändert und mit Chatbot-Fähigkeiten erweitert. Wenn auch vorerst nur unter dem Dach von Google Labs, nur auf Englisch und auch nur für Nutzer, die sich über eine Warteliste qualifizieren müssen. Ein Experiment mit angezogener Handbremse also.
Diese sogenannte Search Generative Experience – kurz SGE – offeriert mittels Künstlicher Intelligenz nicht nur klickbare Suchresultate, sondern erzeugt aus verschiedenen Quellen auch Inhalte – „KI Schnappschuss“ genannt. Zwar offeriert Google schon seit etlichen Jahren in einer Textbox neben den Suchresultaten zusätzliche Informationen, beispielsweise zu Begriffen, oft aus Wikipedia stammend. Doch SGE hat eine ganz neue Qualität, könnte eine Zeitenwende einläuten. Denn der Nutzer kann sich nun regelrecht mittels Text mit der Suchmaschine unterhalten und komplexe Fragen stellen.
Auf der Bühne wurde das am Mittwoch mit der Frage demonstriert, ob der Bryce Canyon Nationalpark oder der Arches Nationalpark besser für Familien ist, die mit einem Hund unterwegs sind. Die aufgepeppte Suchmaschine erwiderte nicht nur mit Informationen über das Für und Wider der beiden Nationalparks inklusive Aktivitäten und klickbaren Links. Sondern gab auch eine Antwort: Bryce Canyon.
Wie sich das kommerzialisieren lässt, zeigte Google anhand eines Fahrradkaufs. Je nach beabsichtigtem Einsatz wird zwischen Rennrädern und Modellen für gemächliche Ausflüge unterschieden, neben Tests, verfügbaren Farben, Lieferzeiten und Sonderangeboten.
Das ist alles eindrucksvoll und praktisch. Aber es könnte das World Wide Web aus den Angeln heben. Warum sollte man noch Webseiten besuchen, wenn eine Künstliche Intelligenz alles übersichtlich auf einer Seite zusammenfasst, garniert mit Fotos, Illustrationen und Videos? Das ist auch für Google gefährlich. Denn die Antworten der Künstlichen Intelligenz kommen nicht aus dem luftleeren Raum, sondern aus dem Abgrasen von Webseiten. Wenn ihre Urheber keinen Verkehr von Suchmaschinen und damit keine Anzeigen mehr bekommen, können diese Inhalte nicht mehr finanziert werden. Im Extremfall müssten die Angebote eingestellt werden oder aber Künstliche Intelligenz so wie einst die Agenten von Suchmaschinen ausgeschlossen werden. Überleben würden dann nur bekannte Marken, die sich über Anzeigen auf ihren Angeboten oder Abos finanzieren. Stirbt damit die Vielfalt im Internet?
Google muss eine Antwort darauf finden, wie die Urheber von Inhalten motiviert und entlohnt werden. Das erklärt, warum der Konzern bisher so zögerlich beim Einsatz von generativer Künstlicher Intelligenz war. Denn damit könnte ein ganzes Ökosystem aus den Angeln gehoben werden, mit dem Google in den vergangenen 25 Jahren Hunderte Milliarden Dollar Gewinn erwirtschaftet hat. Microsoft kann sich hingegen mit seinem spärlichen Bing-Suchmaschinen-Marktanteil Experimente erlauben und dort vorpreschen, weil es nur eine Nebenerwerbsquelle ist.
Wie eine Antwort aussehen könnte, deutete Google am Mittwoch an. Demnach sollen durch generative Künstliche Intelligenz offerierte Inhalte gekennzeichnet werden. Nicht nur, um künstlich erzeugte Bilder oder Texte von menschlichen Werken zu unterscheiden, sondern über Metadaten auch ihren Ursprung nachvollziehen können. Das soll auch Verschwörungstheorien bekämpfen, indem deren Geschichte und Quellen offengelegt werden.
Gleichzeitig will Google seinen Einfluss bei Künstlicher Intelligenz ausbauen, indem es seine Modelle noch offensiver Unternehmenskunden offeriert. Google nennt das Angebot Vertex AI und hat unter anderem die Deutsche Bank als Pilotkunden gewonnen. Es umfasst drei Komponenten – einen Bildgenerator namens Imagen, ein Programmierwerkzeug namens Codey und Chirp, das menschliche Sprache versteht und erzeugt und so beispielsweise Simultanübersetzungen erlaubt.
Neue Schlacht mit Microsoft und Amazon
Klar, hier steht eine Schlacht zwischen Microsofts Cloud Computing Angebot Azure sowie Amazons AWS bevor. Thomas Kurian, Chef der Google Cloud, platzierte am Mittwoch schon mal den ersten Aufschlag. „Unsere für Künstliche Intelligenz offerierte Infrastruktur wird bis zu fünfzig Prozent günstiger als Alternativen sein“, verspricht er.
Ist das nun der nötige Befreiungsschlag? Eine sogenannte Killer-App zeigte Google jedenfalls nicht – beispielsweise eine Smartphone-App, deren Künstliche Intelligenz ganz auf ihren Nutzer zugeschnitten ist. Nicht einmal wurde in der Präsentation der früher stark beworbene Google Assistant erwähnt. Aber die Reise geht in die Richtung eines universal einsetzbaren Helfers.
Google hat hier eindeutige Vorteile. Es hat neben seiner dominanten Suchmaschine eine populäre App wie Google Maps, jede Menge zeitkritische Informationen sowie Tests und kann diese hilfreich verweben, garniert mit Spracherkennung, Sprachausgabe und Simultanübersetzung.
Mehr noch: Google kontrolliert im Gegensatz zu Microsoft und Amazon mit Android nicht nur eine Smartphone-Plattform mit vielen Partnern, sondern hat mit dem Pixel auch eigene Handys. Der große Star der diesjährigen Entwickler-Show ist das Pixel Fold, Googles erste Interpretation eines faltbaren Telefons. Eine Anwendung auf ihm beeindruckte besonders: eine Simultanübersetzung, bei der der Adressat die Antwort in seiner Sprache auf einem der aufgefalteten Displays sehen konnte. Sichtlich gut gelaunt präsentierte Hardware-Chef Rick Osterloh das angeblich dünnste faltbare Smartphone der Welt, allerdings zum stolzen Preis ab 1800 Dollar plus Steuern. Es konkurriert vor allem mit Samsung. Aber auch Apple wird sich hier was einfallen lassen müssen, wenn es ein Bestseller werden sollte.
Sebastian Thrun, ehemals Professor für Künstliche Intelligenz an der Stanford Universität, ehemaliger Google Spitzenmanager und enger Vertrauter von Google-Gründer Larry Page verglich Googles Stand im Wettrennen jüngst in einem WirtschaftsWoche-Interview mit einem Champions-League-Spiel: Die ersten fünf Minuten hat der Gegner Microsoft/OpenAI zwei Tore geschossen. Aber das Spiel läuft noch 85 Minuten. Wie sicher die Position von Trainer Pichai ist? „Relativ sicher“, meint Google Bard.
Lesen Sie auch das Interview mit Sebastian Thrun: „Die wichtigste Stunde der Menschheit“