Anzeige: Sämtliche Inhalte dieser Seite sind ein Angebot von Capgemini. Für den Inhalt ist Capgemini verantwortlich.
Audio-Revolution Warum sich digitale Sprachassistenten durchsetzen werden

Sprachassistenten erobern als zukunftsweisende Technologie immer mehr Anwendungsbereiche. Für Unternehmen lohnen sich Investitionen in die smarten Ansprechpartner.
„Computer, erhöhe die Temperatur im Schlafzimmer.“ – „Siri, spiel mein Lieblingslied.“ – „Alexa, kaufe neues Waschmittel.“ Bisher machen die Sprachassistenten vor allem als kleine Alltagshelfer von sich reden. Gut vernetzt, das heißt in Verbindung mit anderen Geräten und Dienstleistungen, ist das Potenzial der Technologie noch weitaus größer. „Sprachassistenz ist einer der Trends der Zukunft. Neben den Themen Vernetzung, Robotik und Sensorik spielt die cloudbasierte Sprachsteuerung eine wichtige Rolle“, sagt Niels Kuschinsky, Leiter des Bereichs Global Digital Transition bei der BSH Hausgeräte GmbH. Bei Innovations- und IT-Messen weltweit sowie in immer zahlreicheren Anwendungen macht die Technologie im wahrsten Sinne des Wortes von sich reden – im Falle von BSH etwa in digitaler Person von Mykie.
Ein digitaler Hausgeist
Nach Alexa, Siri und Bixby führt Branchenführer BSH mit Mykie einen Herrn in die Riege der Sprachassistenten ein. Anders als die Konkurrenz hat er ein Gesicht und ist als Spezialist für die Küche ausgelegt – wie es sein Name schon andeutet: Mykie ist die Kurzfassung für „My kitchen elf“, zu Deutsch „mein Küchen-Elf“. Mit den richtigen Geräten verknüpft, wird der digitale Hausgeist seinem Namen gerecht und sozusagen allwissend. Er kennt genau den Kühlschrank-Bestand und das dazu passende Rezept. Die Steuerung anderer Haushaltsgeräte wie Wasch- und Spülmaschine kann der Kunde ebenfalls in Mykies digitale Hand geben. Neben der Sprachfunktion gehören Display, Schwenkkopf, Kamera und Projektor zu den Produkteigenschaften. Diese Funktionen machen ihn zu einer potenziellen Plattform für Livechats oder lassen ihn etwa ein Kochvideo oder auch aktuelle Nachrichten direkt mit an die Wand projizieren – alles natürlich auf Sprachbefehl.
Bisher existiert Mykie als Prototyp, aber die Vision von BSH ist klar: Er spielt als smarter Küchenbegleiter eine Hauptrolle in Boschs digitalem Ökosystem Home Connect. „Home Connect ist eine offene Plattform, mit der Hausgeräte verschiedener Marken über eine App gesteuert werden können und die sich mit der zunehmenden Zahl von Services und der Beteiligung neuer Kooperationspartner ständig erweitert“, erklärt Kuschinsky. In dem Kontext werde BSH an seinem Konzept für Sprachassistenz weiterarbeiten und Kompetenzen in dem Feld ausbauen. „Denkbar sind dann verschiedene Anwendungsmöglichkeiten in unseren Hausgeräten, die über das jetzige Konzept hinausgehen.“
Der Entwicklungsaufwand einzelner Lösungen ebenso wie die oft amüsanten und gerne belächelten Sprachfehler von Siri, Alexa und Co. deuten an, wie kompliziert die Technologie in die Anwendung zu bringen ist. „Die Möglichkeiten sind sehr vielschichtig. Das macht das Thema so spannend, aber für Unternehmen auch komplizierter zu managen“, sagt Steffen Elsässer. Er ist der globale Leiter der Customer Experience Unit bei Capgemini Consulting und weiß, warum im Bereich Sprachassistenz momentan „eine Art Goldrausch“ herrscht. Aus Gründen wie Nutzerkomfort, Personalisierung und Multifunktionalität bevorzugen 41 Prozent der Konsumenten Sprachassistenten gegenüber anderen Anwendungsmodi. Diese Vorzüge verschaffen entsprechenden Produkten Wettbewerbsvorteile. Offensichtlich wird der Mehrwert im Handel: „Sobald der Kunde Sprache nutzt, gibt er mehr aus“, bringt es Elsässer auf den Punkt. „Auch, wenn die Technologie noch am Anfang steht, wird deutlich, wie Sprache Barrieren abbaut. Der Trend wird sich nach und nach durchsetzen.“
Jetzt die besten Jobs finden und
per E-Mail benachrichtigt werden.
Der Pizza-Dienst Dominos brachte 2014, kurz vor der Geburt von Amazons Alexa, eine erste App für Sprachbestellungen auf den Markt. Weitere Unternehmen folgten und deren Umsatzentwicklungen zeichnen einen Trend vor, den das Digital Transformation Institute von Capgemini in der Studie Conversational Commerce zusammenfasst. Dieser zufolge steigt das Bestellvolumen mit der Einführung von Sprachassistenz um bis zu zehn Prozent. Perspektivisch wird sich der über Sprachassistenten generierte Umsatz in den nächsten drei Jahren versechsfachen, so die Prognose in der Studie.
Smarte Shopping-Assistenten
„Im Handel sind Sprachassistenten ein neuer Kanal, wie früher auch mal Webseiten eine Neuerung darstellten oder aktueller Mobile Commerce“, macht Elsässer den Vergleich und gibt einen Ausblick auf die Verbreitung der Technologie. „Oftmals setzen sich solche Technologien zunächst im Konsumenten-Kontext durch. Von da machen sie ihren Weg entlang der Wertschöpfungskette und erschließen immer mehr Anwendungsbereiche.“ Für die Entwicklung von Sprachassistenz spielen mobile Endgeräte eine besondere Rolle. Denn Anwender nutzen die Technik vor allem über sie. Entsprechend tummeln sich unter den führenden Anbietern Konzerne wie Apple und Samsung.
Apples Siri ist bereits weitbekannt. Samsung macht mit Bixby vor, wie der Handel der Zukunft aussieht. Die Anwendung erkennt Gegenstände über die Kamera, recherchiert diese im Netz und schafft auf Ansage das Objekt der Begierde an. Das Interesse an Bixby ist groß, wie sich zuletzt etwa bei der Tech-Innovation Messe CES in Las Vegas zeigte. Das Problem: Bixby muss im Sprachkurs nachsitzen, denn sie spricht noch kein Deutsch. Auch Amazon bietet seine Erweiterung mit einer smarten Kamera bisher nur in den USA an und hilft dem Verbraucher so etwa dabei, das richtige Outfit zu finden.
Die Bereitschaft in die Technologie zu investieren ist groß. „Unternehmen stellen sich die Frage, ob sie diese selbst entwickeln oder ob sie auf bestehende Services zugreifen“, sagt Elsässer. Die BSH Hausgeräte GmbH ist dafür ein gutes Beispiel: Mit Küchenassistent Mykie positioniert sie sich mit einem hauseigenen Sprachassistenten im Markt. Ihr Engagement in dem Bereich geht aber über Mykie hinaus. „Zudem ermöglichen wir es über unser offenes System, Hausgeräte auch über andere Sprachdienste wie beispielsweise Alexa zu steuern“, sagt Kuschinsky. „Diese Offenheit entspricht auch der Erwartungshaltung unserer Konsumenten.“ Neben BSH bringen viele Anbieter das System Alexa für ihre Produkte und Services in die Anwendung. Im Amazon-Sprech heißen diese Erweiterungen durch Drittanbieter Skill-Entwicklungen.





Mit dem Auto im Zwiegespräch
In seiner Rolle als Automobilzulieferer treibt der Mischkonzern Bosch das Thema in anderen Bereichen voran – im Fall von Casey genaugenommen hinters Steuer. Sie ist eine smarte Sprachassistentin, die bildlich gesprochen auf Beifahrersitzen Platz nimmt. „Wer in ein modernes Auto einsteigt, kann sich schon manchmal wie ein Pilot fühlen – Knöpfe, Screens und eine unübersichtliche Menüführung“, sagt Dr. Dirk Hoheisel, Geschäftsführer der Robert Bosch GmbH. Mit Casey habe das Knöpfe-Chaos im Cockpit ein Ende.
Wie Mykie bedient auch Casey Kundenwünsche. Einer Umfrage des IT-Branchenverbands Bitkom zufolge sind 14 Prozent der Befragten bereit, sich Verkehrsnachrichten, Kurznachrichten und Mails im Auto vorlesen zu lassen. Im Straßenverkehr bedeutet das nicht bloß nette Spielerei, sondern auch mehr Sicherheit. Anders als bei herkömmlichen Eingabemodi, kann sich der Fahrer dank Sprachassistent voll auf die Straße konzentrieren. Eine Studie des Allianz Zentrums für Technik fasst das so vermiedene Risiko in Zahlen: Demnach fühlen sich 74 Prozent der deutschen Autofahrer regelmäßig abgelenkt, wenn sie auf gewöhnlichem Weg beispielsweise die Navigation bedienen, die Klimaanlage einstellen oder einen Anruf annehmen. Diese möglichen Unfallursachen verhindert Casey.
Über mehr als ein Jahrzehnt Entwicklungszeit hat Bosch nach eigenen Angaben in Casey investiert – und das habe sich gelohnt, betont Hoheisel: „Sagen, was man will, wie man es will – Bosch bringt einen Sprachassistenten ins Auto, der Autofahrer versteht, wie ein Mensch.“ Anders als bisherige Programme reagiert Casey nicht mehr nur auf starre Befehle. Sie versteht natürliche Satzkonstruktionen und verarbeitet Akzente sowie Dialekte – in 30 verschiedenen Sprachen mit insgesamt 44 weiblichen und 9 männlichen Sprecherstimmen zur Auswahl. Der komplexe Bezug auf den jeweiligen Nutzungskontext, etwa auf gespeicherte Kontaktdaten, Uhrzeit und Route, sind weitere Zeichen für Caseys fortgeschrittene künstliche Intelligenz.
Konkurrent Mercedes treibt seine Spracherkennung in eine ähnliche Richtung voran und baut Linguatronic in der E-Klasse aus – Intuition und Personalisierung sind die Schlagworte. Während die Sprachbefehle zunächst auf Infotainment und Navigation beschränkt waren, kommen auch Fahrzeugbefehle hinzu. Als Beispiel nennt Mercedes die Klimafunktionen im Auto: Gebläsestärke, Temperatur und Sitzheizung ließen sich präzise und getrennt für Fahrer und Beifahrer per Sprachbefehl steuern.
Knackpunkt Datensicherheit
Angewendet im Bereich Mobility reduzieren Sprachassistenten ganz offensichtlich das Unfallrisiko. Doch grundsätzlich verweisen Skeptiker auf das vermeintliche Datenrisiko. Datenschutz ist ein Thema, das hierzulande mehr als etwa in den USA oder China die Einführung jeder smarten Technologie begleitet. In besagter Capgemini-Studie sind die entschiedenen Nicht-Nutzer grundsätzlich in der Minderheit; als Hauptgrund für ihre Ablehnung geben sie aber Sicherheitsbedenken beim Datenschutz an. Zudem wünschen sich fast 80 Prozent der Befragten, dass ihre Daten im Gerät bleiben. „In dem Bereich herrscht viel Unwissenheit“, sagt Capgemini-Experte Elsässer. Er ergänzt: „Natürlich hat die Datensicherheit Priorität, doch ohne Vernetzung könnten Sprachdienste ihr Potenzial nicht entfalten und sich vor allem nicht weiterentwickeln.“
Die Interaktion mit Sprachassistenten ist ohne deren Vernetzung auf rudimentäre Befehle beschränkt. Dahingegen lernen sie in Verbindung mit anderen Geräten und Cloud dazu – wie etwa Alexa. Amazons Sprachdienst ist millionenfach mit einer Cloud verbunden. Mit der wachsenden Datenmenge wird sie intelligenter und damit nutzerfreundlicher sowie universeller anwendbar. Mit zunehmendem Komfort und Nutzen verstummen auch die Skeptiker und überlassen das Reden ihrem Sprachassistenten.