KI: Jetzt steuert der Sprachbot ChatGPT von OpenAI schon Roboter

Künstliche Intelligenz Jetzt steuert ChatGPT schon Roboter

24. März 2023

Als Nachtwächter bietet der Sicherheitsdienstleister ADT den humanoiden Roboter des norwegischen Start-ups 1X Technologies an. Neuer führender Investor bei 1X: OpenAI, die Macher von ChatGPT. Das Sprachmodell kann nicht mehr nur Gedichte schreiben, sondern auch Roboter steuern.

Bild: PR

Gerade schrieb er noch Gedichte, jetzt kann der Sprachbot ChatGPT schon Drohnen und Roboter steuern – und sein Schöpfer OpenAI investiert in ein Androiden-Start-up. Wie weit ist es noch vom Textbot bis zum Terminator?

Wie sprachlich versiert künstliche Intelligenz geworden ist, darüber ist in den vergangenen Wochen viel geschrieben worden. Der Sprachbot ChatGPT des Unternehmens OpenAI etwa verfasst ganze Kochrezepte oder empfiehlt einem Salzstangen oder Chips, wenn man ihm mitteilt, dass man Appetit auf etwas Herzhaftes hat. Nur: Zum Küchenschrank gehen muss Mensch noch selbst.

Es sei denn, man arbeitet in einem Labor von Google. Da reicht es, der künstlichen Intelligenz zu sagen: „Bring mir die Reis-Chips aus der Schublade.“ Schon rollt ein Roboter los, groß wie ein zehnjähriges Kind, durchsucht eine Küche, greift mit seiner Zangenhand die Chipstüte aus einer Schublade und bringt sie den Forschern mit.

So ist es in einem Video zu sehen, das Google und die TU Berlin vor wenigen Tagen ins Netz gestellt haben. Die Forscher haben das Sprachmodell Palm, Googles Pendant zu OpenAIs Sprachmodell GPT-4, zu einer Robotersteuerung namens Palm-e aufgemotzt. Sie versteht nicht nur komplizierte Sprachanweisungen – sondern schreibt auch gleich die jeweiligen Steuerbefehle in Form von Softwarecode für den Roboter, der sie in der physischen Welt umsetzen soll.

ChatGPT: Wie die KI funktioniert und welche Einsatzgebiete es gibt

Wem gehört OpenAI und welche Rolle spielt Elon Musk?

OpenAI wurde 2015 als gemeinnützige Forschungs- und Entwicklungsorganisation vom Tesla- und Twitter-Chef Elon Musk sowie dem Technologie-Investor Sam Altman gegründet. Zu den Investoren zählt außerdem der PayPal-Mitgründer Peter Thiel. Im Jahr 2019 wurde ein gewinnorientierter Ableger gegründet, um externe Investitionen einzusammeln. Auch der Software-Konzern Microsoft sicherte sich Anteile an dem Unternehmen, dass bei der jüngsten Finanzierungsrunde Insidern zufolge mit 20 Milliarden Dollar bewertet wurde.

Musk verließ den Verwaltungsrat von OpenAI 2018, lobte ChatGPT auf Twitter allerdings als "erschreckend gut". Allerdings kündigte er später an, den Zugriff von OpenAI auf die Datenbank des Kurznachrichtendienstes vorerst zu sperren. Er habe gerade erst erfahren, dass OpenAI die Daten nutze, um die KI zu trainieren.

Wofür kann ChatGPT genutzt werden?

Mögliche Anwendungsbereiche für das Programm sind Digital-Marketing oder die Beantwortung von Kunden-Anfragen. Einige Nutzer habe ChatGPT sogar dafür genutzt, Software-Code auf Fehler zu prüfen.

Wie funktioniert ChatGPT?

OpenAI zufolge kann ChatGPT einen menschlichen Dialog simulieren, Nachfragen beantworten, Fehler eingestehen, falsche Annahmen revidieren und unangemessene Anfragen zurückweisen. Trainiert werde die Künstliche Intelligenz nach der Methode "Reinforcement Learning from Human Feedback (RLHF)". Dabei bewerten Menschen Schlussfolgerungen, die die Software zieht, um künftige Ergebnisse zu verbessern.

ChatGPT versucht Fragen von Nutzern zu verstehen und in einer schriftlichen Konversation so zu beantworten, wie es ein Mensch täte.

Wo liegen die Probleme?

OpenAI hat eingeräumt, dass ChatGPT die Tendenz hat, „plausibel klingende, aber falsche oder sinnlose Antworten" zu liefern. Die Behebung dieses Problems sei schwierig. Außerdem können durch KI Vorurteile zu ethnischer Zugehörigkeit, Geschlecht oder Kultur weiterverbreitet werden. Auch Google und Amazon hatten mit ethisch fragwürdigen Entscheidungen ihrer jeweiligen KI-Projekte zu kämpfen. Bei anderen Unternehmen mussten Menschen eingreifen, um ein durch die Software verursachtes Chaos einzudämmen.

Es ist ein weiterer verblüffender Schritt, der zeigt, wie mächtig Sprachmodelle in den vergangenen Monaten geworden sind. Erst wurden sie immer besser, Gedichte zu schreiben oder Prüfungsfragen zu beantworten. Vor kurzem zeigte GPT-4, dass es auch die Inhalte von Fotos analysieren kann. Am Donnerstag überraschte OpenAI mit einem AppStore für ChatGPT, der etwa das Reiseportal Expedia oder die Matheplattform Wolfram Alpha mit dem Sprachbot verknüpft. Und nun lernen die Sprachmodelle sogar, die physische Welt zu begreifen und Roboter darin zu steuern. ChatGPT, könnte man sagen, bekommt Arme, Beine und Augen.

Roboter hören jetzt aufs Wort

„Etwas Fundamentales hat sich geändert, auch in Bezug auf die Robotik“, sagt Palm-E-Mitentwickler Marc Toussaint, Leiter des Fachgebietes Intelligente Systeme an der Technischen Universität Berlin. Mit den Algorithmen, die den neuen Sprachmodellen zugrunde liegen – sogenannte Transformer – ließen sich jetzt auch Systeme trainieren, „die in der physischen Welt Entscheidungen treffen müssen.“

Das könnte Robotik und künstliche Intelligenz im Alltag auf eine neue Stufe heben. Bisher mussten Fachleute Roboter für jede Aktion eigens programmieren – das ist langwierig, ineffizient, teuer. Darum werden Roboter bisher meist in Fabriken für Aufgaben eingesetzt, die sich unter kontrollierten Bedingungen immer wiederholen.

Künftig könnte ein Befehl in ganz normaler Sprache reichen, um einem Roboter eine Aufgabe in einer unübersichtlichen Umgebung aufzutragen – und die Algorithmen ermitteln von selbst, wie die Maschine den Job erledigt. „Ich kann jetzt sprachliche Instruktionen an Roboter geben“, sagt Toussaint. Vielleicht mache das Roboter so leicht zu bedienen, „dass es Leute auch interessant fänden, tatsächlich so etwas für die Pflege oder für den Haushalt einzusetzen.“

Lesen Sie auch: Warum Google mit Bard vorpreschen muss

Große Sprachmodelle werden mit riesigen Mengen Text trainiert – und lernen vorherzusagen, welche Wörter am wahrscheinlichsten aufeinander folgen. Auf die Frage: „Was ist die Hauptstadt von Schweden?“ antwortet die KI: Stockholm. Nicht, weil es eine Weltkarte vor Augen hat – sondern weil es in Texten sehr oft die Wörter Schweden, Hauptstadt und Stockholm in einem Zusammenhang vorgefunden hat.

Der Sprachbot schreibt auch den Maschinencode

„Als Robotiker stellt sich die Frage, ob man solche Systeme ähnlich wie Sprachsysteme auch an die physische Welt koppeln kann“, sagt Forscher Toussaint. „Das bedeutet, dass sie nicht nur textuellen Input bekommen, sondern auch Bilder oder Zustandsschätzungen aus der Robotik – und mithilfe dieser Informationen nicht nur textuelle Probleme, sondern auch geometrische Probleme lösen können.“ Genau das haben die Forscher mit Palm-e erreicht. Man könne dem System nun ein Objekt im Raum zeigen, sagt Toussaint, und fragen: Ist das für den Roboter erreichbar?

Forscher von Microsoft haben ähnliche Fähigkeiten dem Sprachbot ChatGPT beigebracht. Ein Video von Microsoft im Internet zeigt, wie sie per Sprachbot einer Drohne die Aufgabe geben: „Suche mir ein Getränk“. Schon hebt die Drohne ab, schaut sich im Raum um und hält schließlich schwebend vor einem Tisch inne, auf dem ein Tetrapack mit Mineralwasser steht.

Und das ist nur das simpelste Beispiel, was die Kombination von Sprachbot und Flugroboter möglich macht. „Suche mir ein Getränk mit Zucker und rotem Logo“ – flink findet die Drohne im Regal eine Cola-Dose. „Mache ein Selfie, indem Du eine reflektierende Oberfläche benutzt“ – auch das klappt.

Auch hier versteht das Sprachmodell nicht nur die verbalen Befehle, sondern schreibt auch gleich den Code, um die Drohne zu steuern. Etwa die Fluganweisung, um im Zick-Zack-Muster an einem Regal entlangzufliegen, um die darin gelagerten Gegenstände zu inspizieren.

Tesla baut schon am Androiden

Derlei Manöver könnten künftig für die Inspektion von Hochregallagern interessant sein oder für die Schadenskontrolle großer Solarparks aus der Luft. In einer Simulation zeigt Microsoft auch schon, wie Drohnen künftig mit einfachen Sprachanweisungen Windkraftanlagen aus der Nähe inspizieren könnten. „Wir freuen uns, diese Technologien zu veröffentlichen, um Robotik einem breiteren Publikum zugänglich zu machen“, schreiben die Forscher in einem Blogbeitrag.

Lesen Sie auch: OpenAI: Startet Elon Musk ein Konkurrenzprojekt?

Was also, wenn ChatGPT bald auch die physische Welt betritt – eingebaut in humanoide Haushaltsrobos, fingerfertige Fabrikroboter? Wenn man den Maschinen nicht kompliziert einprogrammieren muss, was sie tun sollen – sondern es Ihnen einfach zuruft?

Bisher können sich wenige Menschen in Deutschland das vorstellen. Für die Hersteller von Robotern und die Industrie wäre es ein Durchbruch. Allein in der Autoindustrie arbeiten eine Million Roboter weltweit, aber begrenzt hinter Gittern. E-Autohersteller Tesla arbeitet nun an einem humanoiden Roboter mit Armen und Beinen, der frei herumlaufen soll und eines Tages viele Jobs so versiert erledigen soll wie menschliche Kollegen.

Auch OpenAI, das Unternehmen hinter ChatGPT, sichert sich schon smarte Hardware: Am Donnerstag wurde bekannt, dass es eine Finanzierungsrunde über 23,5 Millionen Dollar in das norwegische Robotik-Start-up 1X Technologies angeführt hat. Dessen humanoider Roboter Neo packt in einem Demo-Video zügig Klötze in eine Kiste, öffnet eine Tür und ein Fenster. Auch das US-Start-up Figure und der Konkurrent Boston Dynamics entwickeln Androiden für den Alltag.

here's the video of the robot doing packing from the front page (i think i was having some trouble seeing it on Mobile). this is just nice studio lighting, not CGI! pic.twitter.com/MFZSMqgUWQ
— Eric Jang (@ericjang11) March 7, 2023

Ist deren Einsatz durch den Fortschritt der Sprachmodelle nun wahrscheinlicher geworden? Zumindest bleiben Aufgeben zu lösen, etwa, wie Roboter neue Aufgaben lernen. „Ich glaube nicht, dass sich durch Palm-e fundamental ändert, was Roboter physisch können, also dass sie jetzt besser Kaffee kochen können oder besser etwas lernen können“, sagt Toussaint. Dazu müssten die Maschinen zusätzlich die Fähigkeit zu situativem Lernen entwickeln.

Ziemlich dumme Fehler

Ein möglicher Weg zu dieser Fähigkeit, Probleme zu lösen, könne die Fülle an Daten im Internet sein. Dort gebe es massenhaft Texte und Bilder mit entsprechenden Instruktionen: Wie kann ich einen Knoten öffnen? Wie kann ich eine Flasche öffnen?

Gelänge es einem Roboter, aus all diesen textuellen Beschreibungen von der Manipulation der Welt zu lernen, sagt Toussaint, „dann eröffnete sich ad hoc ein wahnsinnig großes Spektrum an Fähigkeiten dieses Roboters, die wir sonst wirklich nur sehr, sehr schwer erzeugen können“.

Soweit ist es noch nicht. Und schon bei reinen Wissensfragen zeigt ChatGPT immer wieder, dass das System eben doch kein Weltwissen oder gar ein Bewusstsein hat – sondern häufig sogar ziemlich dumme Fehler macht. Sollte man einem solchen System wirklich die Kontrolle von Robotern überlassen?

Lesen Sie auch: Chatbot im Management – „ChatGPT läuft da voll ins Messer“

„Die Ergebnisse von ChatGPT sollten nicht ohne sorgfältige Analyse direkt auf Robotern eingesetzt werden“, warnen die Forscher von Microsoft. Vor einem möglichen Einsatz im richtigen Leben solle man die Algorithmen mit Simulationen testen und bewerten.

„Viele Berufe werden wegfallen“

„Robotik bedeutet, dass wir Systeme haben, die in die Welt eingreifen können“, sagt TU-Berlin-Forscher Toussaint. Und das könnten sie zum Guten wie zum Schlechten. Es gehe jetzt darum, möglichst viel über diese Systeme zu verstehen.

Absehbar sei, dass die Transformer-Systeme mehr und mehr über die reine Sprachverarbeitung hinausgingen und mehr Dinge miteinander verschränkten. „Das bedeutet zum Beispiel auch, dass Systeme womöglich auch Maschinen erfinden können, also mechanische Maschinen. Sich überlegen können, wie eine Fabrik zu designen ist.“

Den Arbeitsmarkt und den Alltag könnte eine solche Technologie erheblich durchrütteln. Schon jetzt seien ChatGPT und Co. bahnbrechend, glaubt Hinrich Schütze, Inhaber des Lehrstuhls für Computerlinguistik an der Ludwig-Maximilians-Universität München (LMU): „Ich würde das als eine Revolution bezeichnen, die mit dem Internet und dem Smartphone vergleichbar ist“, sagt der KI-Forscher. „Es werden sich große Veränderungen ergeben, wie wir schreiben, wie wir programmieren“, sagt Schütze. „Viele Berufe werden wegfallen.“

Ob das zuerst Bürojobs sein werden – oder auch welche in der Fabrik oder auf der Baustelle – und ob aus Sprachbots bald auch Service-Bots in der physischen Welt werden – das kann nicht einmal ChatGPT derzeit vorhersagen.

Lesen Sie auch: 100 Millionen Nutzer in zwei Monaten: Diese Grafiken zeigen den Hype um ChatGPT.

Andreas Menn

Redakteur Innovation & Digitales

KI: Jetzt steuert der Sprachbot ChatGPT von OpenAI schon Roboter

Künstliche Intelligenz Jetzt steuert ChatGPT schon Roboter

ChatGPT: Wie die KI funktioniert und welche Einsatzgebiete es gibt

Roboter hören jetzt aufs Wort

Der Sprachbot schreibt auch den Maschinencode

Tesla baut schon am Androiden

Ziemlich dumme Fehler

„Viele Berufe werden wegfallen“

Entgeltumwandlung Lohnt sich betriebliche Altersvorsorge?

Rezept zum Reichwerden? Das steckt hinter dem System von Deven Schuller

Freiberufler-Report So viel verdienen Selbstständige in Deutschland

Weitere Plus-Artikel lesen Sie hier

Mehr WiWo: Newsletter

Der exklusive Ratgeber WiWo Coach

Der tägliche Kommentar Daily Punch

Aus der WiWo-Chefredaktion Weekender

Der wöchentliche Finanzbrief BörsenWoche

Leseempfehlungen aus der Redaktion Editor’s Pick

Mittelstand – Trends und News Weltmarktführer

Serviceangebote unserer Partner

Stellenmarkt Die besten Jobs auf Handelsblatt.com

Homeday Homeday ermittelt Ihren Immobilienwert

Remind.me Jedes Jahr mehrere hundert Euro Stromkosten sparen – so geht’s

Gymglish Kostenlos kurze, unterhaltsame und personalisierte Online-Sprachkurse testen

Presseportal Lesen Sie die News führender Unternehmen!

Bellevue Ferienhaus Exklusive Urlaubsdomizile zu Top-Preisen

Übersicht Ratgeber, Rechner, Empfehlungen, Angebotsvergleiche

Finanzvergleich Die besten Produkte im Überblick

Gutscheine Mit unseren Gutscheincodes bares Geld sparen

Weiterbildung Jetzt informieren! Alles rund um das Thema Bildung auf einen Blick

Sie haben einen Adblocker aktiviert. Deshalb ist unsere Seite für Sie aktuell nicht erreichbar.