Cortana, Siri, Google Now: Sprachassistenten verändern unser Leben
Am 4. April 1975 gründen die Kindheitsfreunde Bill Gates und Paul Allen das Start-up Microsoft in Albuquerque, New Mexico. Die jungen Computerliebhaber haben eine Vision: den Desktop-PC in Haushalten verbreiten. Das Softwareunternehmen, das heute in Redmond im US-Bundesstaat Washington sitzt, ebnet mit Mikrocomputern den Weg zum Personal Computer (PC).
Foto: dpa/picture-allianceMS-DOS (1980)
1980 bekommt Microsoft von IBM den Auftrag, ein Betriebssystem für den geplanten Personal Computer (PC) zu entwickeln. Etwa ein Jahr später – im Sommer 1981 – bietet Microsoft das 16-Bit Vorläuferbetriebssystem MS-DOS 1.0 an. Durch vertraglich festgelegte Konditionen erhält das Unternehmen die Berechtigung, das „Disk Operation System“ auch anderen Herstellern zu verkaufen.
Foto: dpa Picture-AllianceWindows 1.0 (1985)
Mitte der Achtziger Jahre veröffentlicht Microsoft schließlich das erste – quasi noch unbrauchbare – Windows. Es ist eine vielmehr eine grafische Erweiterung für MS-DOS als ein eigenständiges Betriebssystem. Eine Bedienung per Maus gibt es in Windows 1.0 ebenso wenig wie grafische Icons.
Foto: dpa Picture-AllianceWindows 2 (1987)
Microsoft stellt 1987 Windows 2 vor. Apple wirft Microsoft Ideenklau vor und klagt vor Gericht. Den komplizierten Rechtsstreit entscheidet Microsoft fünf Jahre später für sich, da die Mac-ähnlichen Icons, die Einzug in das Windows-Betriebssystem finden, nicht urheberrechtlich geschützt sind.
Foto: PresseWindows 3.X (1990-1994)
Am 22. Mai 1990 kommt Windows 3.0 auf den Markt. Als wirklich brauchbare Variante von Windows wird aber erst die optimierte Version 3.11 angesehen, die vier Jahre später erscheint. Es wird 10 Millionen Mal in den ersten zwei Jahren verkauft. Das erste 32-Bit-System für Workstations und Server – Windows NT – präsentiert Microsoft bereits 1993.
Foto: PresseWindows 95 (1995)
Windows 95 wird im Sommer mit einem zuvor unüblichen Marketing-Aufwand veröffentlicht. In den ersten fünf Wochen verkauft sich das neue System bereits sieben Millionen Mal. Noch im gleichen Jahr erwähnt Gates sein Vorhaben, die Entwicklung des Internets aktiv unterstützen und stärken zu wollen.
Foto: dpaWindows 98 (1998)
1998 kommt Windows 98 als Weiterentwicklung von Windows 95 auf den Markt. Mit der 98er-Version unterstützt das Microsoft-Bertiebssystem unter anderem erstmals von Haus aus den damals neuen USB-Standard und auch die Verwendung von mehreren Monitoren an einem Rechner.
Foto: REUTERSWindows ME (2000)
Microsoft stellt die Windows Millennium Edition (Windows Me) vor. Das Unternehmen selbst wirbt mit einer simplen, intuitiven Bedienung. Diese Variante des Betriebssystems erweist sich allerdings – entgegen der Bestrebungen von Microsoft – als besonders fehleranfällig. Es ist die letzte Windows-Variante, die auf MS-DOS setzt.
Foto: dpa Picture-AllianceWindows XP (2001)
Nur ein Jahr später bringt Microsoft Windows XP heraus, sein bisher langlebigstes Betriebssystem. Bei der Produkteinführung in New York sind zahlreiche Marktführer der PC-Industrie und 50 Microsoft-Partner anwesend. XP setzt auf der Architektur der Windows-NT-Familie auf.
Foto: dpa Picture-AllianceWindows Vista (2007) und Windows 7 (2009)
Windows Vista soll neue Möglichkeiten bieten. Mit Microsoft Office 2007 stehen dem Nutzer neue Werkzeuge zur Text-, Bild- und Informationsbearbeitung zur Verfügung. Das neue Betriebssystem ist im Vergleich zur Vorläufer-Konsumentenversion deutlich stabiler und verkauft sich gut. Nach eigenen Angaben von Microsoft wurden bis 2010 60 Millionen Lizenzen verkauft. Nutzer bemängeln dennoch die umständliche Bedienung, die mit Windows 7 (Markteinführung 2009) ausgebessert wurde.
Foto: imago / sportfotodienstWindows 8 (2012)
Windows 8 verfügt über zwei unterschiedliche Benutzeroberflächen: eine Kacheloptik für Tablets und ein herkömmlicher Windows-Desktop für PCs. Anwender vermissen den beliebten Start-Button. Ein Jahr später wird das System auf die Version 8.1 aktualisiert.
Foto: dpaWindows 10 (2015)
Mit Windows 10 bietet Microsoft eine einheitliche technische Plattform für PCs, Tablets und Smartphones an. Das von Nutzern ersehnte Start-Menü kehrt auf den Desktop zurück. Am 29. Juli stellt der Softwaregigant das jüngste Betriebssystem vor. Ein Jahr lang ist das Upgrade auf Windows 10 für Computer mit Windows 7 und 8.1 kostenlos. Was das neue System bringt und für welche Nutzer es sinnvoll ist, lesen Sie hier.
Quellen: microsoft.com, dpa
Foto: dpaDie Zeiten sind vorbei, da Menschen, die gestikulierend und vor sich hin sprechend auf der Straße standen, als – vorsichtig formuliert – mental angeschlagen galten. Heute ahnt der mobilkommunikative Zeitgenosse: Der einsame Plauderer nebenan ist kerngesund, hat den Hörer der Freisprecheinrichtung im Ohr und telefoniert mit entfernten Gesprächspartnern. Oder er wendet sich gerade direkt an sein Handy: „Hey Siri“, „Hey Cortana“, „Okay Google“, die klassischen Signalsätze, um die Spracherkennung in den Handys von Apple, Microsoft oder mit Googles Android zu aktivieren.
Künftig kommen solche Zwiegespräche zwischen Mensch und Maschine nicht mehr nur auf der Straße vor – sondern auch am Schreibtisch. Denn so wie heute Millionen von Smartphone-Besitzern Apples sprachgesteuerten, digitalen Assistenten Siri in ihren iPhones nutzen oder den Cyber-Sekretär Google Now in Android-Telefonen, werden wir künftig auch unseren Schreibtisch-PCs Aufträge diktieren – und sie werden uns antworten.
Verantwortlich für den Sprung dieser Technik in die klassische PC-Welt ist Microsofts neues Windows 10. Das wird der Softwaregigant ab Ende Juli nicht bloß weltweit Abermillionen Kunden als kostenlosen Download anbieten. Es beherbergt zugleich mit der App Cortana erstmals einen kommunikativen Softwareassistenten als Kernfunktion eines PC-Betriebssystems: Ohne dass der Nutzer noch einen Buchstaben tippen müsste, lauscht der Rechner dann seinen Befehlen.
Die psychische Grenze sinkt
Auf eine vergleichbare Funktion warten Apple-Anwender bei ihren Mac-Computern bis heute. Und das, obwohl die Kalifornier ihre Sprachsoftware Siri schon 2011 mit dem iPhone 4s vorgestellt und damit die quasi natürliche Kommunikation mit der Maschine eingeführt haben. Auch Microsoft hat Cortana bereits vergangenes Jahr in einer Vorabversion auf seine Lumia-Telefone gebracht, der BlackBerry Assistant lauscht mittlerweile ebenso aufs Wort, und Amazons Echo oder demnächst wohl Facebooks Moneypenny wollen da ebenfalls nicht abseits stehen.
Zudem mit der Ausbreitung der Technik zugleich die Akzeptanz wächst: Nutzte laut Verbrauchs- und Medienanalyse noch vor zwei Jahren nur knapp jeder zehnte Deutsche über 14 Jahren die Sprachsteuerung seines Handys, war es 2014 schon rund jeder sechste. Und mit dem Sprung der Technik auf den Tischrechner wird sich dieser Trend noch beschleunigen.
Plaudern mit dem PC, das ist viel mehr als bloß ein nettes Feature. „Wenn Millionen von Nutzern plötzlich in natürlicher Sprache mit ihren Rechnern kommunizieren, wird das den Umgang mit der Technik grundlegend verändern“, sagt Reinhard Karger, Präsident der Deutschen Gesellschaft für Information und Wissen (DGI). Bisher habe der Zwang zur händischen Eingabe stets als technische und psychische Grenze zwischen Mensch und Elektronenhirn gestanden. „Wenn wir aber künftig mit dem Rechner wie mit einem Freund oder Bekannten reden, definiert das auch die Beziehung neu.“
Zudem einige Programme immer besser werden, vor allem Google Now antwortet erstaunlich ausführlich und korrekt. Künftig nun wissen auch die grauen Kästen auf dem Schreibtisch die Antwort auf die Frage nach dem nächsten Spiel des Lieblingsvereins oder berichten auf Wunsch, wie es an der Börse läuft.
Microsoft hat früher als erwartet mit der Verteilung von Windows 10 begonnen. Eigentlich war die Auslieferung für den 29. Juli 2015 geplant. Die Teilnehmer des Windows-Insider-Programms können aber bereits jetzt die fertige Version beziehen.
Foto: dpa
Mit Windows 10 stellt Microsoft auf das automatische Einspielen von Funktions-Updates um. Die Nutzer müssen also nicht mehr jahrelang auf eine nächste Windows-Version warten. Die Updates werden künftig ausgeliefert, sobald sie fertig entwickelt sind. Vor der Auslieferung sind die Updates von den Teilnehmern des Insider-Programms getestet worden. Das Programm beteiligt interessierte Nutzer an der Softwareentwicklung und -prüfung.
Foto: Screenshot
Microsoft hat damit erstmals die Anwender direkt befragt und eingebunden, um das Produkt so nutzerfreundlich und kundenorientiert wie möglich zu machen. Mit dem globalen Insider-Programm haben sich laut Microsoft mehr als vier Millionen Anwender mit ihren Anforderungen und Vorschlägen beteiligt.
Foto: ScreenshotMicrosoft greift nach der von der Konkurrenz gesetzten Messlatte und will cross-funktionaler werden. Was bei Apple schon lange Standard ist, soll mit Windows 10 nun aufgeholt und noch besser werden. Zukünftig werden alle Microsoft-Applikationen vollumfänglich über alle Endgeräte hinweg funktionieren und miteinander vernetzbar sein, so dass Änderungen an Dokumenten auf allen Geräten zeitgleich zur Verfügung stehen.
Foto: ScreenshotMit Windows 10 kehrt Microsoft zum bekannten Startmenü zurück. Der Anwender gelangt so mit einem Klick zu den Funktionen und Dokumenten, die am häufigsten genutzt werden. Der Startbereich wird zukünftig einen erweiterten Favoritenbereich über alle Anwendungen hinweg beinhalten.
Foto: ScreenshotMicrosoft verspricht die Revolution für mobile Endgeräte: Das Aktionszentrum erhält eine erweiterte Ansicht für eine bessere Übersicht über alle laufenden Applikationen. Dabei sind die Benachrichtigungen zukünftig interaktiv gestaltet, so dass man direkt aus der Benachrichtigung eine Aktion starten kann, wie beispielsweise den Alarm auszuschalten. Auch die Umwandlungsfähigkeit von Text zu Sprache soll stark verbessert sein.
Foto: ScreenshotWindows 10 startet mit einem neuen Browser ins Rennen, der laut Microsoft sehr leistungsstark sein wird und selbst komplexeste Seiten sofort lädt. Er soll der bisher einzige Browser sein, über den Kommentare direkt auf der Seite eingefügt werden und mit anderen Nutzern geteilt werden können. Es wird einen integrierten Lesemodus geben, der sämtliche störende Elemente der Seite herausfiltert. Diese Ansicht steht auch im Offline Modus zur Verfügung um sich Seiten für späteres Lesen ablegen zu können.
Foto: ScreenshotDie Cloudfunktion wird durch eine Autosync – Funktion erweitert. So können Fotos und automatisch erstellte Alben mit anderen Nutzern geteilt werden. Gleiches soll für Musik und die neue Navigationsanwendung gelten.
Foto: ScreenshotFür die Office Anwendungen gibt es laut Microsoft zukünftig kostenfreie Vollversionen für Tablets und Smartphones. Es soll zum Beispiel möglich sein Texte in Word zu editieren oder einen voll umfänglichen Präsentationsmodus in Powerpoint zu nutzen, der online oder über eine Drahtlosverbindung funktioniert.
Foto: WirtschaftsWoche, ScreenshotWichtige Neuerungen gibt es auch für die Nutzerfreundlichkeit von Outlook. Microsoft verspricht eine wesentlich übersichtlichere und einfachere Bearbeitung des Posteingangs. Die Kalenderfunktion soll wesentlich leichter in der Handhabung werden, speziell was die Kategorisierung und Übersichtlichkeit der Termine angeht.
Foto: ScreenshotSiri bekommt Konkurrenz: Cortana heißt die Microsoft Assistentin, die darauf getrimmt ist, das persönliche Nutzerverhalten zu beobachten und so mehr und mehr über dessen Vorlieben und Angewohnheiten lernt. Laut Microsoft wird Cortana zur wertvollen Unterstützung, egal ob es um Terminorganisation, E-Mail Versand, Internetrecherche oder Navigation geht.
Foto: ScreenshotAuch die Xbox wird zukünftig mit in das Netzwerk eingebunden. So wird es zum Beispiel möglich Spiele von der Xbox auf ein Windows 10 Gerät zu streamen und in wenigen Sekunden den Mitschnitt eines Spielverlaufs zu starten.
Foto: WirtschaftsWoche
Das erscheint fast spielerisch und ist doch alles andere als trivial. Vor allem geht es weit über die Spracherkennungsprogramme hinaus, mit denen Mediziner oder Juristen seit Langem Arztbriefe oder Protokolle diktieren. Da reicht es, Klänge sinnvoll in Wortfolgen zu übersetzen. Die digitalen Gesprächshilfen von heute hingegen können mithilfe hochkomplexer semantischer Verfahren und enormer Rechenpower Inhalt und Intention von Fragen und Kommandos tatsächlich verstehen.
Erst der Mix ganz unterschiedlicher Technologien in jüngster Zeit führt dazu, „dass wir jetzt die Demokratisierung der Sprachsteuerung von Maschinen erleben“, erläutert Michael Bruss. Der 38-jährige Linguist und Phonetiker arbeitet beim Saarbrücker Spracherkennungsspezialisten Semvox. Dessen Software kann ähnlich wie die Systeme hinter Siri, Cortana und Co. aus den Sprachbefehlen destillieren, wonach der Nutzer sucht, respektive, welchen Auftrag er der Maschine erteilen will.
Das erfordert eine Rechenleistung, die weder die schnellsten Smartphones noch PCs bisher liefern können. Kaum weniger anspruchsvoll ist – nach der Inhaltsanalyse – die Suche nach den gewünschten Informationen.
Alle Assistenten lösen das Dilemma durch ein Zusammenspiel aus Software auf dem Gerät des Nutzers und IT-Systemen im Netz: PC oder Handy zeichnen das Kommando auf, schicken es in die Rechenzentren von Apple, Google oder Microsoft. Deren Spracherkennungs- und -analysesysteme werten die Anfrage aus, recherchieren die Antwort und senden die zurück zum Nutzer. Dessen Gerät gibt das Ergebnis schließlich per Textanzeige oder Sprache wieder. „Ohne das schnelle mobile Internet einerseits und den Boom des Cloud Computing andererseits“, sagt Semvox-Experte Bruss, „wäre der Erfolg der digitalen Assistenten gar nicht denkbar.“
Zumal sich Sprachsteuerung schon bald nicht mehr auf Smartphones, Tablets, Laptop-Computer oder Schreibtisch-PCs beschränken wird: „In dem Maße, in dem wir uns daran gewöhnen, Telefonen und Rechnern Aufträge zu erteilen, werden wir das auch mit anderen technischen Geräten tun“, sagt DGI-Präsident Karger.
Auch die Heizung gehorcht aufs Wort
Die Technik steht schon bereit. Google etwa hat seine Nest-Thermostate bereits mit Sprachbedienung via Google Now aufgerüstet. Das Unternehmen Enertex aus dem fränkischen Forchheim vertreibt mit dem Home-Controller Synohr eine per Sprache steuerbare Schaltstelle fürs smarte Heim. Apple hat das Softwaremodul HomeKit in seine Software integriert. Ob schaltbare Steckdose oder Dimmer für die Lampe – wer das Gerät mit dem iPhone gekoppelt hat, kann Siri auch Haushaltsjobs übertragen.
Auch hinterm Autosteuer ersetzen Sprachbefehle den Druck auf Schalter oder Touch-Bildschirme. Alle Premiumhersteller bauen bereits auf Wunsch Technik zur Sprachsteuerung in die aktuellen Fahrzeuge ein. Der Softwarehersteller Nuance – mit seiner Technik Teil der Intelligenz von Siri und Google Now – wird im Herbst auf der Internationalen Automobilausstellung in Frankfurt (IAA) einen eigenen persönlichen Assistenten vorstellen.
Die Kommunikation zwischen Fahrer und Auto wird immer ungezwungener werden: „Durch den Trend zum autonomen Fahren werden die Fahrzeuge immer intelligenter“, sagt Ralf Lamberti, für das Thema Nutzerführung bei Mercedes-Benz verantwortlich. In den Limousinen mit dem Stern verarbeitet die Linguatronic-Plattform schon heute Sprachbefehle für die Navigation sowie zur Wiedergabe von Musik oder von Nachrichten. Und das sei erst der Anfang, sagt Lamberti: „In fünf bis zehn Jahren wird sich ein Großteil der Dienste und Funktionen im Fahrzeug per natürlicher Sprache oder Gesten steuern lassen.“
Wobei zumindest für die Informations- und Unterhaltungsangebote noch völlig offen ist, wer am Ende tatsächlich den Dialog mit dem Nutzer führt – und zwar nicht bloß im Auto. Denn um die Frage, wer den Zugang ins Netz kontrolliert, wer die Sprachbefehle auswertet und – vor allem – welche Antworten er liefert, entfaltet sich in den kommenden Jahren der nächste Kampf der digitalen Riesen.
Wenn der Dialog der Nutzer mit sprachgesteuerten Assistenten immer häufiger die traditionelle Suche im Netz ersetzt, erschüttert das die Vormachtstellung der etablierten Torwächter in den digitalen Raum.
Jeder Sprachauftrag an Apples Siri oder Microsofts Cortana liefert Antworten, ohne dabei Googles bezahlte Suchanzeigen auf den Handyschirm zu bringen. Jeder mündlich abgesetzte Facebook-Status findet seinen Weg ins Netz, ohne dass der Absender dabei noch eine gesponserte Werbebotschaft im sozialen Netzwerk zu Gesicht bekäme.
Eine Zukunft ohne Apps?
Wer bemüht noch traditionelle Suchmaschinen, wenn es wie beim Recherche-Automaten Echo, den der Versandriese Amazon Ende 2014 vorgestellt hat, reicht, Aufträge einfach laut in den Raum zu sprechen? Das Gerät im Format einer Getränkedose hört mit, speichert und erinnert an Termine, spielt auf Zuruf Musik ab und erstellt, oh Wunder, Einkaufslisten.
Die Entwicklung unterminiert nicht nur die Dominanz der Suchmaschinen als primären (und profitablen) Weg ins Netz. Sie stellt genauso infrage, ob im Zeitalter digitaler Assistenten überhaupt noch Apps erforderlich sind – wenn der Cyber-Sekretär eh daran vorbei im Internet recherchiert. Wer etwa Google Now eine Bahnverbindung suchen lässt, ordert darüber künftig womöglich auch das Ticket – ohne dass die Bahn die Chance hätte, auch noch das Hotelbett am Ziel zu verkaufen.
Das sind mehr als Gedankenspiele. Was sich daran zeigt, mit welcher Vehemenz die verschiedenen Spieler auf konkurrierende Plattformen drängen. Google etwa bietet Google Now auch als iPhone-App an. Microsofts oberster Windows-Chef Joe Belfiore hat erst Ende Mai verkündet: „Wir geben Windows-Nutzern die Möglichkeit, die Intelligenz von Cortana auch auf Android-Telefonen und iPhones zu nutzen.“
Das war nicht bloß in eine Freisprechanlage gemurmelt. Das war eine Kampfansage: Die digitalen Assistenten werden nicht nur die Beziehung zwischen Mensch und Maschine neu definieren – auch der Kampf um die Vorherrschaft im Netz wird neu entschieden.