Das erscheint fast spielerisch und ist doch alles andere als trivial. Vor allem geht es weit über die Spracherkennungsprogramme hinaus, mit denen Mediziner oder Juristen seit Langem Arztbriefe oder Protokolle diktieren. Da reicht es, Klänge sinnvoll in Wortfolgen zu übersetzen. Die digitalen Gesprächshilfen von heute hingegen können mithilfe hochkomplexer semantischer Verfahren und enormer Rechenpower Inhalt und Intention von Fragen und Kommandos tatsächlich verstehen.
Erst der Mix ganz unterschiedlicher Technologien in jüngster Zeit führt dazu, „dass wir jetzt die Demokratisierung der Sprachsteuerung von Maschinen erleben“, erläutert Michael Bruss. Der 38-jährige Linguist und Phonetiker arbeitet beim Saarbrücker Spracherkennungsspezialisten Semvox. Dessen Software kann ähnlich wie die Systeme hinter Siri, Cortana und Co. aus den Sprachbefehlen destillieren, wonach der Nutzer sucht, respektive, welchen Auftrag er der Maschine erteilen will.
Das erfordert eine Rechenleistung, die weder die schnellsten Smartphones noch PCs bisher liefern können. Kaum weniger anspruchsvoll ist – nach der Inhaltsanalyse – die Suche nach den gewünschten Informationen.
Sprechende Handys
Alle Assistenten lösen das Dilemma durch ein Zusammenspiel aus Software auf dem Gerät des Nutzers und IT-Systemen im Netz: PC oder Handy zeichnen das Kommando auf, schicken es in die Rechenzentren von Apple, Google oder Microsoft. Deren Spracherkennungs- und -analysesysteme werten die Anfrage aus, recherchieren die Antwort und senden die zurück zum Nutzer. Dessen Gerät gibt das Ergebnis schließlich per Textanzeige oder Sprache wieder. „Ohne das schnelle mobile Internet einerseits und den Boom des Cloud Computing andererseits“, sagt Semvox-Experte Bruss, „wäre der Erfolg der digitalen Assistenten gar nicht denkbar.“
Zumal sich Sprachsteuerung schon bald nicht mehr auf Smartphones, Tablets, Laptop-Computer oder Schreibtisch-PCs beschränken wird: „In dem Maße, in dem wir uns daran gewöhnen, Telefonen und Rechnern Aufträge zu erteilen, werden wir das auch mit anderen technischen Geräten tun“, sagt DGI-Präsident Karger.
Auch die Heizung gehorcht aufs Wort
Die Technik steht schon bereit. Google etwa hat seine Nest-Thermostate bereits mit Sprachbedienung via Google Now aufgerüstet. Das Unternehmen Enertex aus dem fränkischen Forchheim vertreibt mit dem Home-Controller Synohr eine per Sprache steuerbare Schaltstelle fürs smarte Heim. Apple hat das Softwaremodul HomeKit in seine Software integriert. Ob schaltbare Steckdose oder Dimmer für die Lampe – wer das Gerät mit dem iPhone gekoppelt hat, kann Siri auch Haushaltsjobs übertragen.
Die Entwicklungsstufen Künstlicher Intelligenz
Der britische Informatiker entwickelt den nach ihm benannten Test. Er soll ermitteln, ob eine Maschine denken kann wie ein Mensch. Ein russischer Chat-Roboter soll ihn 2014 erstmals bestanden haben.
Experten einigen sich auf den Begriff "Künstliche Intelligenz". Der Rechner IBM 702 dient ersten Forschungen.
Katerstimmung bei den Forschern: Die Fortschritte bleiben hinter den Erwartungen zurück. Computer sind zu langsam, ihre Speicher zu klein, um die Daten von Bildern oder Tönen zu verarbeiten. Budgets werden gestrichen, erst ab 1980 geht es wieder voran.
Der Supercomputer von IBM siegt im Schachduell gegen Weltmeister Garry Kasparov. Die Maschine bewertete 200 Millionen Positionen pro Sekunde. 2011 siegt IBMs Software Watson in der Quizsendung "Jeopardy".
Der KI-Forscher sagt in einem Buch für das Jahr 2045 den Moment der "Singularität" voraus: Die Rechenleistung aller Computer erreicht die aller menschlichen Gehirne. Seit 2012 arbeitet Kurzweil für Google an KI-Systemen.
Ein Google-Programm beschreibt präzise in ganzen Sätzen, was auf Fotos zu sehen ist. Nahrungsmittelkonzern Nestlé kündigt an, 1000 sprechende Roboter namens Pepper in seinen Kaffeeläden in Japan als Verkäufer einzusetzen. Physiker Stephen Hawking warnt: KI könne eines Tages superschlau werden – und die Menschheit vernichten.
Computer sind schlau wie Menschen – und machen sogar Witze. Fabriken, Verkehr und Landwirtschaft sind nahezu komplett automatisiert.
Auch hinterm Autosteuer ersetzen Sprachbefehle den Druck auf Schalter oder Touch-Bildschirme. Alle Premiumhersteller bauen bereits auf Wunsch Technik zur Sprachsteuerung in die aktuellen Fahrzeuge ein. Der Softwarehersteller Nuance – mit seiner Technik Teil der Intelligenz von Siri und Google Now – wird im Herbst auf der Internationalen Automobilausstellung in Frankfurt (IAA) einen eigenen persönlichen Assistenten vorstellen.