Microsoft-Projekt: Skype wird zum Dolmetscher

ThemaInnovationen

Microsoft-Projekt: Skype wird zum Dolmetscher

von Christof KerkmannQuelle:Handelsblatt Online

Nieder mit der Sprachbarriere: Der IT-Riese Microsoft hat ein System entwickelt, das Gespräche mit dem Telefondienst Skype in Echtzeit übersetzt. Doch der Prototyp zeigt: Noch ist der Mensch dem Computer überlegen.

Wenn Captain Kirk mit den Klingonen spricht, übersetzt im Hintergrund ein Computer in interstellarer Angelegenheit. Im echten Leben ist die Kommunikation jedoch nicht so einfach wie in der Weltraum-Serie „Star Trek“ – selbst wenn Menschen unterschiedlicher Herkunft miteinander sprechen: Obwohl sich die Technologie rasant entwickelt, taugt sie noch nicht als Dolmetscher.

Zahlreiche Forscher und Firmen arbeiten daran, die Science Fiction Wirklichkeit werden zu lassen – auch Microsoft. Der Konzern führte am Dienstag einen Übersetzer für sein Telefon-Programm Skype vor. Das System dolmetschte zwischen Englisch und Deutsch, weitere Sprachen sind in Planung.

Anzeige

Ein erster Schritt

„Seitdem wir angefangen haben zu sprechen, wollten wir die Sprachbarriere überqueren“, sagte Microsoft-Chef Satya Nadella bei der Code Conference des US-Blogs Recode. Die neue Software ist indes höchstens ein erster Schritt über die Schwelle.

In der Vorführung erledigte die Software ihre Aufgabe zügig, aber mit einigen Missverständnissen und Fehlern, die man von Sprachschülern kennt. So tat sie sich bei der Satzstellung schwer.

"Hallo Diane, wie dir’s geht"

"Hello Diana, how are you doing?", fragte Microsoft-Manager Gurdeep Singh Pall seine deutsche Kollegin Diana Heinrichs im Videotelefonat. "Hallo Diane, wie dir’s geht", sagte die blecherne Stimme nach kurzer Rechenzeit.

Auch einige Satzkonstruktionen baute die Software falsch zusammen. Den Tipp "There are some fabulous restaurants, I was told", übersetzte sie mit „Ich habe einige fabelhafte Restaurants gibt es erzählt" – richtig gewesen wäre: "Man hat mir gesagt, es gibt einige fabelhafte Restaurants". Und aus "You are right" wurde "Du bist. Recht."

Spracherkennungstechnik

  • Aufnahme

    Je professioneller die Technik, desto besser. Unter guten Umständen können aber auch die Aufnahme-Apps moderner Apple- oder Android-Smartphones ordentliche Ergebnisse liefern.

  • Aussteuerung

    Entscheidend ist Aussteuerung. Zu leise und verrauschte Aufnahmen kann die Software nicht verstehen. Der Sprecher sollte nicht mehr als 50 Zentimeter vom Aufnahmegerät entfernt sein.

  • Dateiformat

    Je stärker die Aufnahme komprimiert wird, desto mehr muss die Erkennungssoftware raten. Die beste Qualität erreicht man daher mit unkomprimierten WAV-Dateien, im Test funktionierten aber auch gut ausgesteuerte MP3-Dateien.

  • Nachbearbeitung

    Blind verlassen darf man sich auf die Erkennung nicht. Bei allen Dateien mussten zumindest einige Punkte und Kommas von Hand nachgetragen werden.

Nah dran, aber nicht ganz richtig. Damit entspricht das Microsoft-System nach Einschätzung einer Expertin dem aktuellen Stand der Forschung: "Es kann den Sinn der Unterhaltung wiedergeben, aber es passieren dabei Fehler", sagt Laura Elisabeth Jehl vom Institut für Computerlinguistik der Universität Heidelberg.

Im Hintergrund der Übersetzung laufen komplexe Prozesse ab: Zunächst muss die Software die gesprochenen Wörter erkennen, sie dann übersetzen und anschließend wieder vorlesen. Bei jedem Schritt können Fehler passieren, also bei der Spracherkennung wie bei der Übersetzung.

Noch nicht ausgereift

Das Ende der babylonischen Zustände ist aber noch weit entfernt. "Die jetzigen Systeme werden nicht alle Nuancen übersetzen können", betont Jehl. "Sie versuchen nicht, Sprache zu verstehen, sondern bauen anhand großer Datenmengen eine Wissensbasis auf."

Wenn "Indian food" häufig als "indisches Essen" übersetzt wird, wird dieser Satzbaustein übernommen. Microsoft will für die Verbesserung der Funktion Skype-Gespräche auswerten, die Zustimmung der Nutzer vorausgesetzt.

Weitere Artikel

Es geht um Wahrscheinlichkeiten, nicht um Sprachgefühl. Welche Schwierigkeiten das mit sich bringt, zeigte die Microsoft-Demonstration: In der menschlichen Sprache kommen viele mehrdeutige Wörter vor – "move" kann "bewegen", aber auch "umziehen" bedeuten. Ohne den Kontext ist kaum zu beantworten, ob es um einen Umzug oder etwas anderes geht.

Eine Testversion der Funktion Skype Translate soll den Nutzern im Laufe des Jahres zur Verfügung gestellt werden. Eine kommerzielle Version ist nach Microsoft-Angaben im Laufe von zweieinhalb Jahren möglich.

Ob man irgendwann auch denn Sinn klingonischer Unterhaltungen erfassen kann?

Quelle:  Handelsblatt Online
Anzeige
Deutsche Unternehmerbörse - www.dub.de
DAS PORTAL FÜR FIRMENVERKÄUFE
– Provisionsfrei, unabhängig, neutral –
Angebote Gesuche




.

Zur Startseite
-0%1%2%3%4%5%6%7%8%9%10%11%12%13%14%15%16%17%18%19%20%21%22%23%24%25%26%27%28%29%30%31%32%33%34%35%36%37%38%39%40%41%42%43%44%45%46%47%48%49%50%51%52%53%54%55%56%57%58%59%60%61%62%63%64%65%66%67%68%69%70%71%72%73%74%75%76%77%78%79%80%81%82%83%84%85%86%87%88%89%90%91%92%93%94%95%96%97%98%99%100%