WiWo App 1 Monat für nur 0,99 €
Anzeigen

Computer mit Ohren Sprachsteuerung erorbert die Märkte

Handys, Heim-PCs, Navigationsgeräte, ja sogar Kampfflugzeuge gehorchen schon aufs Wort. Die Sprachsteuerung ist jetzt ausgereift und erobert die Märkte.

  • Artikel teilen per:
  • Artikel teilen per:
Yahoo rüstet sein neues mobiles Suchportal oneSearch mit Spracherkennung aus Quelle: Pressefoto

"Stuttgart, Willi-Bleicher-Straße 22", nuschelt der Fahrer mit schwäbischem Akzent, nachdem er die Spracherkennung des Navigationsgeräts per Taste am Lenkrad "scharf" gestellt hat. Keine 20 Sekunden später beginnt das System mit der Routenführung. Der Besitzer der Mercedes A-Klasse guckt zufrieden: "Wenn ich früher mein Navi eingestellt habe, musste ich den Blick gefährlich oft von der Straße nehmen." Nun kann er sich ganz auf den Verkehr konzentrieren.

Was bisher Luxus-Limousinen vorbehalten war, taucht nun immer öfter in Kompakt- und Kleinwagen auf: die Steuerung der elektronischen Wegweiser und anderen Funktionen wie Telefon und Autoradio per Sprache statt der umständlichen Eingabe über ein Menü. Selbst im neuen Fiat 500 gehorcht das aufpreispflichtige Navigationsgerät dank der Softwarelösung "Blue & Me" von Microsoft aufs Wort, ohne aufwendige Schulung des Systems.

Auf leisen Sohlen schleicht sich die Sprachsteuerung in unseren Alltag und erobert mit zunehmender Raffinesse und Leistungsfähigkeit in rascher Folge immer neue Anwendungen:

Mobiltelefone kramen die richtige Nummer aus dem Speicher, wenn man ihnen sagt, wen man anrufen möchte, und lesen Kurznachrichten vor. Seniorenwohnungen werden so ausgestattet, dass Rollläden, Fernseher und Telefon auf Zuruf reagieren. Ärzte stellen im Operationssaal das Licht per Stimmanweisung heller oder dunkler. Piloten des Kampfflugzeugs Eurofighter können der Maschine Befehle per Stimme erteilen. Sprachdialogsysteme bei Behörden, Banken und Versicherungen erfragen die Wünsche des Anrufers, bevor sie ihn an den zuständigen Ansprechpartner weiterleiten. Mehr als 100.000 Kunden der Postbank überweisen täglich per Sprachautomat Geld oder fragen den Kontostand und Produktinformationen ab. Google-Konkurrent Yahoo rüstet sein neues mobiles Suchportal „oneSearch 2.0“ mit Spracherkennung aus. Statt Texte mühselig einzutippen, lassen sie sich dem Computer zum Beispiel mit der Sprachsoftware „Dragon Naturally Speaking“ des US-Herstellers Nuance einfach diktieren.

Top-Jobs des Tages

Jetzt die besten Jobs finden und
per E-Mail benachrichtigt werden.

Standort erkennen

    Spracherkennung ist Kinderschuhen entwachsen

    Und das ist erst der Anfang. Wolfgang Wahlster, Direktor des Deutschen Forschungszentrums für Künstliche Intelligenz (DFKI) in Saarbrücken, schätzt das erst gut zehn Prozent der potenziellen Anwendungen erschlossen sind. Die Technik habe das Potenzial, die Arbeitswelt umzukrempeln und alte Gewohnheiten radikal zu ändern. Das sieht Nuance-Chef Paul Ricci genauso: „Sprachgesteuerte Systeme und Geräte werden in absehbarer Zukunft so allgegenwärtig sein wie heute das Internet.“

    Die Spracherkennung ist den Kinderschuhen längst entwachsen und auf dem besten Weg, ein Kassenschlager zur werden. Nach Prognosen der britischen Marktforscher von Datamonitor werden die weltweiten Umsätze mit Sprachdialogsystemen bis 2010 auf gut 1,1 Milliarden Dollar wachsen – gegenüber knapp 700 Millionen in diesem Jahr. In Europa entwickelt sich der deutsche Markt mit jährlichen Zuwachsraten von mehr als 20 Prozent am dynamischsten. Die Verkäufe sollen sich bis 2010 mit dann knapp 200 Millionen Dollar nahezu verdoppeln. Deutschland ist hinter Großbritannien derzeit der zweitgrößte Markt für Sprachdialogsysteme in Europa.

    Auffälligster Trend ist die Zunahme kleinerer Systeme für den Mittelstand sowie für mobile Anwendungen. „In zehn Jahren werden alle Geräte eine sprachgesteuerte Schnittstelle besitzen“, prognostiziert David Nahamoo, Sprachexperte bei IBM.

    Begünstigt wird die schnelle Verbreitung durch sinkende Preise, Miniaturisierung und eine wachsende Alltagsreife. Neueste Systeme begreifen selbst komplexe Kommandos im ersten Anlauf. „Nebengeräusche oder ein Schnupfen sind kein Problem mehr. Die Software erkennt die Worte des Sprechers trotzdem“, sagt Bernhard Steimel, Chef des Beratungsunternehmens Mind Business Consultants in Meerbusch bei Düsseldorf und Mitinitiator der Voice Days, dem Gipfeltreffen der deutschen Sprachtechnologie-Experten. Dieses Jahr kommt der Kreis am 15. und 16. Oktober in Wiesbaden zusammen.

    sprache_grafik

    Dagegen waren die Anfänge vor einem Vierteljahrhundert ärmlich. Der erste, 1983 vorgestellte Sprachcomputer des US-Unternehmens Intervoice hatte noch die Größe eines Großrechners. Die Systeme verstanden nur wenige vorgegebene Worte und meist auch nur einen Sprecher. Heute passen die Systeme in jede Westentasche, etwa als Komfortmodul im Handy: „Ilse“ ruft der Nutzer salopp in das Mikrofon und wird prompt mit seiner Bekannten verbunden.

    Stürmisch schreitet der Einsatz im Auto voran – aus gutem Grund. „Das Bedienen per Stimme erhöht messbar die Sicherheit beim Autofahren“, resümiert Mark Vollrath, Professor am Institut für Kognitions- und Ingenieurpsychologie der Technischen Universität Braunschweig. Gleiches gilt für die Sendersuche im Radio, die Musikauswahl oder das sprachgesteuerte Telefonieren, so das Ergebnis einer aktuellen Laborstudie. Noch ist nicht alles perfekt, auch das hat Vollrath herausgefunden: So haben viele Geräte mit plappernden Mitfahrern ihre liebe Not. „Ich lasse daher gern meinen Beifahrer das Ziel aufsprechen“, räumt Fatima Vital die Schwäche ein, leitende Managerin für die Autosysteme bei Nuance.

    Zu den akustischen Problemen kommen inhaltliche. Vertrackt für die Erkennungssoftware sind sogenannte Homophone. Das sind Worte, die gleich klingen, aber Unterschiedliches bedeuten – so wie „mehr“ und „Meer“ oder „Wagen“, „wagen“ oder „Waagen“. Da den Systemen menschliche Intuition und das Gespür für den Kontext abgeht, wird mithilfe der Wahrscheinlichkeitsrechnung die wahrscheinlichste Kombinationen herausgesucht. So ist die Wortfolge „mehr wagen“ einleuchtender als „Meer-Waagen“.

    Dienstleister und Industrie haben Potenzial entdeckt

    Auch Dienstleister und Industrie haben das Potenzial der künstlichen Sprache entdeckt: Laut Datamonitor werden allein in Deutschland mehr als 300.000 Anschlüsse betrieben, bei denen sich nur noch eine Roboterstimme meldet. „Man kann mittlerweile von fast neun Millionen automatisierten Anrufen pro Tag ausgehen“, schätzt Branchenexperte Steimel.

    Top-Jobs des Tages

    Jetzt die besten Jobs finden und
    per E-Mail benachrichtigt werden.

    Standort erkennen

      Erstaunlich ist, wie gut die Sprachdialogsysteme inzwischen funktionieren und wo sie bereits überall eingesetzt werden. „Aktuell tummeln sich etwa 120 Unternehmen mit circa 10.000 Mitarbeitern auf dem deutschen Markt“, weiß Steimel. Gut 90 Prozent der Anwendungen dienen der Kommunikation zwischen Unternehmen und Kunden. Banken, Telekommunikations- und Logistikunternehmen sind die Vorreiter – Versicherungen ziehen langsam nach. Sie müssen täglich mit Millionen von Kunden telefonieren. Da zählt jeder Cent.

      Nach einer Studie von Mind Business und dem Beraterunternehmen Strateco aus Bad Homburg bei Frankfurt zahlt sich die Anschaffung einer Sprachdialogsystems im Durchschnitt nach neuneinhalb Monaten aus – bei Anschaffungskosten von meist weniger als 100 000 Euro. Einige Unternehmen fürchten zwar einen Imageverlust, wenn die Sprachapplikation mal nicht perfekt funktioniert.

      Forscher des Fraunhofer-Instituts für Arbeitswirtschaft und Organisation (IAO) in Stuttgart halten die Sorge aber für unbegründet. Denn Unternehmen, die Sprachdialogsysteme einsetzen, gelten als innovativ und professionell, ergab eine Umfrage unter Kunden. Allerdings hängen Akzeptanz und Zufriedenheit von einem einfachen und komfortablen Sprachdialog ab.

      Die Telekom-Tochter T-Mobile geht noch einen Schritt weiter. Ihr System zieht Schlüsse über Alter, Geschlecht, Muttersprache und die Stimmung des Anrufers. Ist er gut gelaunt oder kocht er vor Wut? Der Sprachcomputer stellt sich darauf ein – in Tonfall und Wortwahl.

      © Handelsblatt GmbH – Alle Rechte vorbehalten. Nutzungsrechte erwerben?
      Zur Startseite
      -0%1%2%3%4%5%6%7%8%9%10%11%12%13%14%15%16%17%18%19%20%21%22%23%24%25%26%27%28%29%30%31%32%33%34%35%36%37%38%39%40%41%42%43%44%45%46%47%48%49%50%51%52%53%54%55%56%57%58%59%60%61%62%63%64%65%66%67%68%69%70%71%72%73%74%75%76%77%78%79%80%81%82%83%84%85%86%87%88%89%90%91%92%93%94%95%96%97%98%99%100%