1. Startseite
  2. Technologie
  3. Digitale Welt
  4. Cortana, Siri, Google Now: Sprachassistenten verändern unser Leben

Cortana, Siri, Google NowSprachassistenten verändern unser Leben

Mit Windows 10 erobern sprachgesteuerte Assistenten auch den PC. Das verändert das Zusammenspiel von Mensch und Maschine radikal. Computer lernen, den Menschen zu verstehen.Thomas Kuhn 28.07.2015 - 18:00 Uhr

Am 4. April 1975 gründen die Kindheitsfreunde Bill Gates und Paul Allen das Start-up Microsoft in Albuquerque, New Mexico. Die jungen Computerliebhaber haben eine Vision: den Desktop-PC in Haushalten verbreiten. Das Softwareunternehmen, das heute in Redmond im US-Bundesstaat Washington sitzt, ebnet mit Mikrocomputern den Weg zum Personal Computer (PC).

Foto: dpa/picture-alliance

MS-DOS (1980)

1980 bekommt Microsoft von IBM den Auftrag, ein Betriebssystem für den geplanten Personal Computer (PC) zu entwickeln. Etwa ein Jahr später – im Sommer 1981 – bietet Microsoft das 16-Bit Vorläuferbetriebssystem MS-DOS 1.0 an. Durch vertraglich festgelegte Konditionen erhält das Unternehmen die Berechtigung, das „Disk Operation System“ auch anderen Herstellern zu verkaufen.

Foto: dpa Picture-Alliance

Windows 1.0 (1985)

Mitte der Achtziger Jahre veröffentlicht Microsoft schließlich das erste – quasi noch unbrauchbare – Windows. Es ist eine vielmehr eine grafische Erweiterung für MS-DOS als ein eigenständiges Betriebssystem. Eine Bedienung per Maus gibt es in Windows 1.0 ebenso wenig wie grafische Icons.

Foto: dpa Picture-Alliance

Windows 2 (1987)

Microsoft stellt 1987 Windows 2 vor. Apple wirft Microsoft Ideenklau vor und klagt vor Gericht. Den komplizierten Rechtsstreit entscheidet Microsoft fünf Jahre später für sich, da die Mac-ähnlichen Icons, die Einzug in das Windows-Betriebssystem finden, nicht urheberrechtlich geschützt sind.

Foto: Presse

Windows 3.X (1990-1994)

Am 22. Mai 1990 kommt Windows 3.0 auf den Markt. Als wirklich brauchbare Variante von Windows wird aber erst die optimierte Version 3.11 angesehen, die vier Jahre später erscheint. Es wird 10 Millionen Mal in den ersten zwei Jahren verkauft. Das erste 32-Bit-System für Workstations und Server – Windows NT – präsentiert Microsoft bereits 1993.

Foto: Presse

Windows 95 (1995)

Windows 95 wird im Sommer mit einem zuvor unüblichen Marketing-Aufwand veröffentlicht. In den ersten fünf Wochen verkauft sich das neue System bereits sieben Millionen Mal. Noch im gleichen Jahr erwähnt Gates sein Vorhaben, die Entwicklung des Internets aktiv unterstützen und stärken zu wollen.

Foto: dpa

Windows 98 (1998)

1998 kommt Windows 98 als Weiterentwicklung von Windows 95 auf den Markt. Mit der 98er-Version unterstützt das Microsoft-Bertiebssystem unter anderem erstmals von Haus aus den damals neuen USB-Standard und auch die Verwendung von mehreren Monitoren an einem Rechner.

Foto: REUTERS

Windows ME (2000)

Microsoft stellt die Windows Millennium Edition (Windows Me) vor. Das Unternehmen selbst wirbt mit einer simplen, intuitiven Bedienung. Diese Variante des Betriebssystems erweist sich allerdings – entgegen der Bestrebungen von Microsoft – als besonders fehleranfällig. Es ist die letzte Windows-Variante, die auf MS-DOS setzt.

Foto: dpa Picture-Alliance

Windows XP (2001)

Nur ein Jahr später bringt Microsoft Windows XP heraus, sein bisher langlebigstes Betriebssystem. Bei der Produkteinführung in New York sind zahlreiche Marktführer der PC-Industrie und 50 Microsoft-Partner anwesend. XP setzt auf der Architektur der Windows-NT-Familie auf.

Foto: dpa Picture-Alliance

Windows Vista (2007) und Windows 7 (2009)

Windows Vista soll neue Möglichkeiten bieten. Mit Microsoft Office 2007 stehen dem Nutzer neue Werkzeuge zur Text-, Bild- und Informationsbearbeitung zur Verfügung. Das neue Betriebssystem ist im Vergleich zur Vorläufer-Konsumentenversion deutlich stabiler und verkauft sich gut. Nach eigenen Angaben von Microsoft wurden bis 2010 60 Millionen Lizenzen verkauft. Nutzer bemängeln dennoch die umständliche Bedienung, die mit Windows 7 (Markteinführung 2009) ausgebessert wurde.

Foto: imago / sportfotodienst

Windows 8 (2012)

Windows 8 verfügt über zwei unterschiedliche Benutzeroberflächen: eine Kacheloptik für Tablets und ein herkömmlicher Windows-Desktop für PCs. Anwender vermissen den beliebten Start-Button. Ein Jahr später wird das System auf die Version 8.1 aktualisiert.

Foto: dpa

Windows 10 (2015)

Mit Windows 10 bietet Microsoft eine einheitliche technische Plattform für PCs, Tablets und Smartphones an. Das von Nutzern ersehnte Start-Menü kehrt auf den Desktop zurück. Am 29. Juli stellt der Softwaregigant das jüngste Betriebssystem vor. Ein Jahr lang ist das Upgrade auf Windows 10 für Computer mit Windows 7 und 8.1 kostenlos. Was das neue System bringt und für welche Nutzer es sinnvoll ist, lesen Sie hier.

Quellen: microsoft.com, dpa

Foto: dpa

Die Zeiten sind vorbei, da Menschen, die gestikulierend und vor sich hin sprechend auf der Straße standen, als – vorsichtig formuliert – mental angeschlagen galten. Heute ahnt der mobilkommunikative Zeitgenosse: Der einsame Plauderer nebenan ist kerngesund, hat den Hörer der Freisprecheinrichtung im Ohr und telefoniert mit entfernten Gesprächspartnern. Oder er wendet sich gerade direkt an sein Handy: „Hey Siri“, „Hey Cortana“, „Okay Google“, die klassischen Signalsätze, um die Spracherkennung in den Handys von Apple, Microsoft oder mit Googles Android zu aktivieren.

Wie klug sind die Sprachassistenten im Vergleich?
Zur Studie
Google Now
Siri von Apple
Cortana von Microsoft

Künftig kommen solche Zwiegespräche zwischen Mensch und Maschine nicht mehr nur auf der Straße vor – sondern auch am Schreibtisch. Denn so wie heute Millionen von Smartphone-Besitzern Apples sprachgesteuerten, digitalen Assistenten Siri in ihren iPhones nutzen oder den Cyber-Sekretär Google Now in Android-Telefonen, werden wir künftig auch unseren Schreibtisch-PCs Aufträge diktieren – und sie werden uns antworten.

Verantwortlich für den Sprung dieser Technik in die klassische PC-Welt ist Microsofts neues Windows 10. Das wird der Softwaregigant ab Ende Juli nicht bloß weltweit Abermillionen Kunden als kostenlosen Download anbieten. Es beherbergt zugleich mit der App Cortana erstmals einen kommunikativen Softwareassistenten als Kernfunktion eines PC-Betriebssystems: Ohne dass der Nutzer noch einen Buchstaben tippen müsste, lauscht der Rechner dann seinen Befehlen.

Die psychische Grenze sinkt

Auf eine vergleichbare Funktion warten Apple-Anwender bei ihren Mac-Computern bis heute. Und das, obwohl die Kalifornier ihre Sprachsoftware Siri schon 2011 mit dem iPhone 4s vorgestellt und damit die quasi natürliche Kommunikation mit der Maschine eingeführt haben. Auch Microsoft hat Cortana bereits vergangenes Jahr in einer Vorabversion auf seine Lumia-Telefone gebracht, der BlackBerry Assistant lauscht mittlerweile ebenso aufs Wort, und Amazons Echo oder demnächst wohl Facebooks Moneypenny wollen da ebenfalls nicht abseits stehen.

Wie Windows wurde, was es ist
Windows 1.0
Windows 3.1
Windows NT
Windows 95
Windows XP
Windows 7
Windows 8
Windows 8.1
Windows 10

Zudem mit der Ausbreitung der Technik zugleich die Akzeptanz wächst: Nutzte laut Verbrauchs- und Medienanalyse noch vor zwei Jahren nur knapp jeder zehnte Deutsche über 14 Jahren die Sprachsteuerung seines Handys, war es 2014 schon rund jeder sechste. Und mit dem Sprung der Technik auf den Tischrechner wird sich dieser Trend noch beschleunigen.

Plaudern mit dem PC, das ist viel mehr als bloß ein nettes Feature. „Wenn Millionen von Nutzern plötzlich in natürlicher Sprache mit ihren Rechnern kommunizieren, wird das den Umgang mit der Technik grundlegend verändern“, sagt Reinhard Karger, Präsident der Deutschen Gesellschaft für Information und Wissen (DGI). Bisher habe der Zwang zur händischen Eingabe stets als technische und psychische Grenze zwischen Mensch und Elektronenhirn gestanden. „Wenn wir aber künftig mit dem Rechner wie mit einem Freund oder Bekannten reden, definiert das auch die Beziehung neu.“

Zudem einige Programme immer besser werden, vor allem Google Now antwortet erstaunlich ausführlich und korrekt. Künftig nun wissen auch die grauen Kästen auf dem Schreibtisch die Antwort auf die Frage nach dem nächsten Spiel des Lieblingsvereins oder berichten auf Wunsch, wie es an der Börse läuft.

Microsoft hat früher als erwartet mit der Verteilung von Windows 10 begonnen. Eigentlich war die Auslieferung für den 29. Juli 2015 geplant. Die Teilnehmer des Windows-Insider-Programms können aber bereits jetzt die fertige Version beziehen.

Foto: dpa

Mit Windows 10 stellt Microsoft auf das automatische Einspielen von Funktions-Updates um. Die Nutzer müssen also nicht mehr jahrelang auf eine nächste Windows-Version warten. Die Updates werden künftig ausgeliefert, sobald sie fertig entwickelt sind. Vor der Auslieferung sind die Updates von den Teilnehmern des Insider-Programms getestet worden. Das Programm beteiligt interessierte Nutzer an der Softwareentwicklung und -prüfung.

Foto: Screenshot

Microsoft hat damit erstmals die Anwender direkt befragt und eingebunden, um das Produkt so nutzerfreundlich und kundenorientiert wie möglich zu machen. Mit dem globalen Insider-Programm haben sich laut Microsoft mehr als vier Millionen Anwender mit ihren Anforderungen und Vorschlägen beteiligt.

Foto: Screenshot

Microsoft greift nach der von der Konkurrenz gesetzten Messlatte und will cross-funktionaler werden. Was bei Apple schon lange Standard ist, soll mit Windows 10 nun aufgeholt und noch besser werden. Zukünftig werden alle Microsoft-Applikationen vollumfänglich über alle Endgeräte hinweg funktionieren und miteinander vernetzbar sein, so dass Änderungen an Dokumenten auf allen Geräten zeitgleich zur Verfügung stehen.

Foto: Screenshot

Mit Windows 10 kehrt Microsoft zum bekannten Startmenü zurück. Der Anwender gelangt so mit einem Klick zu den Funktionen und Dokumenten, die am häufigsten genutzt werden. Der Startbereich wird zukünftig einen erweiterten Favoritenbereich über alle Anwendungen hinweg beinhalten.

Foto: Screenshot

Microsoft verspricht die Revolution für mobile Endgeräte: Das Aktionszentrum erhält eine erweiterte Ansicht für eine bessere Übersicht über alle laufenden Applikationen. Dabei sind die Benachrichtigungen zukünftig interaktiv gestaltet, so dass man direkt aus der Benachrichtigung eine Aktion starten kann, wie beispielsweise den Alarm auszuschalten. Auch die Umwandlungsfähigkeit von Text zu Sprache soll stark verbessert sein.

Foto: Screenshot

Windows 10 startet mit einem neuen  Browser ins Rennen, der laut Microsoft sehr leistungsstark sein wird und selbst komplexeste Seiten sofort lädt.  Er soll der bisher einzige Browser sein, über den Kommentare direkt auf der Seite eingefügt werden  und mit anderen Nutzern geteilt werden können. Es wird einen integrierten Lesemodus geben, der sämtliche störende Elemente der Seite herausfiltert. Diese Ansicht steht auch im Offline Modus zur Verfügung um sich Seiten für späteres Lesen ablegen zu können.

Foto: Screenshot

Die Cloudfunktion wird durch eine Autosync – Funktion erweitert. So können Fotos und automatisch erstellte Alben mit anderen Nutzern geteilt werden. Gleiches soll für Musik und die neue Navigationsanwendung gelten.

Foto: Screenshot

Für die Office Anwendungen gibt es laut Microsoft zukünftig kostenfreie Vollversionen für Tablets und Smartphones. Es soll zum Beispiel möglich sein Texte in Word zu editieren oder einen voll umfänglichen Präsentationsmodus in Powerpoint zu nutzen, der online oder über eine Drahtlosverbindung funktioniert.

Foto: WirtschaftsWoche, Screenshot

Wichtige Neuerungen gibt es auch für die Nutzerfreundlichkeit von Outlook. Microsoft verspricht eine wesentlich übersichtlichere und einfachere Bearbeitung des Posteingangs. Die Kalenderfunktion soll wesentlich leichter in der Handhabung werden, speziell was die Kategorisierung und Übersichtlichkeit der Termine angeht.

Foto: Screenshot

Siri bekommt Konkurrenz: Cortana heißt die Microsoft Assistentin, die darauf getrimmt ist, das persönliche Nutzerverhalten zu beobachten und so mehr und mehr über dessen Vorlieben und Angewohnheiten lernt. Laut Microsoft wird Cortana zur wertvollen Unterstützung, egal ob es um Terminorganisation, E-Mail Versand, Internetrecherche oder Navigation geht.  

Foto: Screenshot

Auch die Xbox wird zukünftig mit in das Netzwerk eingebunden. So wird es zum Beispiel möglich Spiele von der Xbox auf ein Windows 10 Gerät zu streamen und in wenigen Sekunden den Mitschnitt eines Spielverlaufs zu starten.

Foto: WirtschaftsWoche

Das erscheint fast spielerisch und ist doch alles andere als trivial. Vor allem geht es weit über die Spracherkennungsprogramme hinaus, mit denen Mediziner oder Juristen seit Langem Arztbriefe oder Protokolle diktieren. Da reicht es, Klänge sinnvoll in Wortfolgen zu übersetzen. Die digitalen Gesprächshilfen von heute hingegen können mithilfe hochkomplexer semantischer Verfahren und enormer Rechenpower Inhalt und Intention von Fragen und Kommandos tatsächlich verstehen.

Cortana, Siri und Google Now im Vergleich: Wie schnell und korrekt die digitalen Assistenten Fragen beantworten.

Erst der Mix ganz unterschiedlicher Technologien in jüngster Zeit führt dazu, „dass wir jetzt die Demokratisierung der Sprachsteuerung von Maschinen erleben“, erläutert Michael Bruss. Der 38-jährige Linguist und Phonetiker arbeitet beim Saarbrücker Spracherkennungsspezialisten Semvox. Dessen Software kann ähnlich wie die Systeme hinter Siri, Cortana und Co. aus den Sprachbefehlen destillieren, wonach der Nutzer sucht, respektive, welchen Auftrag er der Maschine erteilen will.

Das erfordert eine Rechenleistung, die weder die schnellsten Smartphones noch PCs bisher liefern können. Kaum weniger anspruchsvoll ist – nach der Inhaltsanalyse – die Suche nach den gewünschten Informationen.

Die Entwicklungsstufen Künstlicher Intelligenz
1950 - Alan Turing
1956 - Dartmouth-Konferenz
1974 - Erster KI-Winter
1997 - Deep Blue
2005 - Ray Kurzweil
2014 - KI-Boom
2045 - Roboter-Revolution

Alle Assistenten lösen das Dilemma durch ein Zusammenspiel aus Software auf dem Gerät des Nutzers und IT-Systemen im Netz: PC oder Handy zeichnen das Kommando auf, schicken es in die Rechenzentren von Apple, Google oder Microsoft. Deren Spracherkennungs- und -analysesysteme werten die Anfrage aus, recherchieren die Antwort und senden die zurück zum Nutzer. Dessen Gerät gibt das Ergebnis schließlich per Textanzeige oder Sprache wieder. „Ohne das schnelle mobile Internet einerseits und den Boom des Cloud Computing andererseits“, sagt Semvox-Experte Bruss, „wäre der Erfolg der digitalen Assistenten gar nicht denkbar.“

Zumal sich Sprachsteuerung schon bald nicht mehr auf Smartphones, Tablets, Laptop-Computer oder Schreibtisch-PCs beschränken wird: „In dem Maße, in dem wir uns daran gewöhnen, Telefonen und Rechnern Aufträge zu erteilen, werden wir das auch mit anderen technischen Geräten tun“, sagt DGI-Präsident Karger.

Auch die Heizung gehorcht aufs Wort

Die Technik steht schon bereit. Google etwa hat seine Nest-Thermostate bereits mit Sprachbedienung via Google Now aufgerüstet. Das Unternehmen Enertex aus dem fränkischen Forchheim vertreibt mit dem Home-Controller Synohr eine per Sprache steuerbare Schaltstelle fürs smarte Heim. Apple hat das Softwaremodul HomeKit in seine Software integriert. Ob schaltbare Steckdose oder Dimmer für die Lampe – wer das Gerät mit dem iPhone gekoppelt hat, kann Siri auch Haushaltsjobs übertragen.

Auch hinterm Autosteuer ersetzen Sprachbefehle den Druck auf Schalter oder Touch-Bildschirme. Alle Premiumhersteller bauen bereits auf Wunsch Technik zur Sprachsteuerung in die aktuellen Fahrzeuge ein. Der Softwarehersteller Nuance – mit seiner Technik Teil der Intelligenz von Siri und Google Now – wird im Herbst auf der Internationalen Automobilausstellung in Frankfurt (IAA) einen eigenen persönlichen Assistenten vorstellen.

Die Kommunikation zwischen Fahrer und Auto wird immer ungezwungener werden: „Durch den Trend zum autonomen Fahren werden die Fahrzeuge immer intelligenter“, sagt Ralf Lamberti, für das Thema Nutzerführung bei Mercedes-Benz verantwortlich. In den Limousinen mit dem Stern verarbeitet die Linguatronic-Plattform schon heute Sprachbefehle für die Navigation sowie zur Wiedergabe von Musik oder von Nachrichten. Und das sei erst der Anfang, sagt Lamberti: „In fünf bis zehn Jahren wird sich ein Großteil der Dienste und Funktionen im Fahrzeug per natürlicher Sprache oder Gesten steuern lassen.“

Wobei zumindest für die Informations- und Unterhaltungsangebote noch völlig offen ist, wer am Ende tatsächlich den Dialog mit dem Nutzer führt – und zwar nicht bloß im Auto. Denn um die Frage, wer den Zugang ins Netz kontrolliert, wer die Sprachbefehle auswertet und – vor allem – welche Antworten er liefert, entfaltet sich in den kommenden Jahren der nächste Kampf der digitalen Riesen.

Wenn der Dialog der Nutzer mit sprachgesteuerten Assistenten immer häufiger die traditionelle Suche im Netz ersetzt, erschüttert das die Vormachtstellung der etablierten Torwächter in den digitalen Raum.

Jeder Sprachauftrag an Apples Siri oder Microsofts Cortana liefert Antworten, ohne dabei Googles bezahlte Suchanzeigen auf den Handyschirm zu bringen. Jeder mündlich abgesetzte Facebook-Status findet seinen Weg ins Netz, ohne dass der Absender dabei noch eine gesponserte Werbebotschaft im sozialen Netzwerk zu Gesicht bekäme.

Eine Zukunft ohne Apps?

Wer bemüht noch traditionelle Suchmaschinen, wenn es wie beim Recherche-Automaten Echo, den der Versandriese Amazon Ende 2014 vorgestellt hat, reicht, Aufträge einfach laut in den Raum zu sprechen? Das Gerät im Format einer Getränkedose hört mit, speichert und erinnert an Termine, spielt auf Zuruf Musik ab und erstellt, oh Wunder, Einkaufslisten.

Die Entwicklung unterminiert nicht nur die Dominanz der Suchmaschinen als primären (und profitablen) Weg ins Netz. Sie stellt genauso infrage, ob im Zeitalter digitaler Assistenten überhaupt noch Apps erforderlich sind – wenn der Cyber-Sekretär eh daran vorbei im Internet recherchiert. Wer etwa Google Now eine Bahnverbindung suchen lässt, ordert darüber künftig womöglich auch das Ticket – ohne dass die Bahn die Chance hätte, auch noch das Hotelbett am Ziel zu verkaufen.

Das sind mehr als Gedankenspiele. Was sich daran zeigt, mit welcher Vehemenz die verschiedenen Spieler auf konkurrierende Plattformen drängen. Google etwa bietet Google Now auch als iPhone-App an. Microsofts oberster Windows-Chef Joe Belfiore hat erst Ende Mai verkündet: „Wir geben Windows-Nutzern die Möglichkeit, die Intelligenz von Cortana auch auf Android-Telefonen und iPhones zu nutzen.“

Das war nicht bloß in eine Freisprechanlage gemurmelt. Das war eine Kampfansage: Die digitalen Assistenten werden nicht nur die Beziehung zwischen Mensch und Maschine neu definieren – auch der Kampf um die Vorherrschaft im Netz wird neu entschieden.

Mehr zum Thema
Unsere Partner
Anzeige
Stellenmarkt
Die besten Jobs auf Handelsblatt.com
Anzeige
Homeday
Homeday ermittelt Ihren Immobilienwert
Anzeige
IT BOLTWISE
Fachmagazin in Deutschland mit Fokus auf Künstliche Intelligenz und Robotik
Anzeige
Remind.me
Jedes Jahr mehrere hundert Euro Stromkosten sparen – so geht’s
Anzeige
Presseportal
Lesen Sie die News führender Unternehmen!
Anzeige
Bellevue Ferienhaus
Exklusive Urlaubsdomizile zu Top-Preisen
Anzeige
Übersicht
Ratgeber, Rechner, Empfehlungen, Angebotsvergleiche
Anzeige
Finanzvergleich
Die besten Produkte im Überblick
Anzeige
Gutscheine
Mit unseren Gutscheincodes bares Geld sparen
Anzeige
Weiterbildung
Jetzt informieren! Alles rund um das Thema Bildung auf einen Blick