WiWo App Jetzt gratis testen
Anzeigen

Spracherkennung Wenn der Computer zum Sekretär wird

Seite 3/3

Brauchbar, nicht perfekt

Wie Computer wurden, was sie sind
Apple-Mitgründer Steve Jobs wollte einen Computer entwickeln, den jeder bedienen kann. Inspiration fand er im Forschungszentrum Xerox PARC: Dort hatten die Tüftler eine grafische Benutzeroberfläche (graphical user interface, GUI) programmiert, die Jobs bei einem Besuch elektrisierte. „Innerhalb von zehn Minuten war mir klar, dass eines Tages alle Computer so arbeiten würden“, sagte er Jahre später in einem Fernsehinterview. 1983 brachte Apple das Modell Lisa samt einer Maus heraus – den ersten Computer mit grafischer Benutzeroberfläche für den Massenmarkt. Allerdings reagierte die Technik nur sehr behäbig. Und der Preis von 10.000 Dollar war für die meisten Privatanwender zu hoch (in Deutschland kostete der Rechner 30.000 DM). Lisa erwies sich als großer Flop, die Restbestände wurden später in der Wüste von Utah entsorgt. Doch Lisa bahnte der Technologie den Weg. Quelle: mac-history.net
Doch Steve Jobs ließ sich vom Misserfolg mit dem Lisa nicht beirren und entwickelte bei Apple mit einem verschworenen Team den Macintosh, der sich ebenfalls mit einer Maus bedienen ließ und deutlich billiger war. Hier ist der junge Firmengründer (l.) 1984 bei der Vorstellung des Rechners mit dem damaligen Apple-Chef John Sculley zu sehen. Der Werbespot für diesen Computer, gedreht von Regisseur Ridley Scott, ist bis heute legendär – er soll zeigen, wie der Apple-Rechner die geknechteten Nutzer von IBM, dem „Big Brother“ mit seinen Einheits-PCs, befreit.
Das Gerät sollte nicht die Geschäftsleute begeistern, sondern die Massen. In Sachen Benutzerfreundlichkeit setzte Apple Maßstäbe, doch der Erfolg stellte sich erst über die Jahre ein, zumal Konkurrent IBM mit seinem PC reißenden Absatz fand. Der war zwar nicht so bequem zu bedienen, es gab aber viel mehr Anwendungen für ihn. Immerhin gelang es Apple mit der Zeit, eine treue Fangemeinde aufzubauen – auch in den Jahren ohne Steve Jobs. Der musste Apple 1985 nach einem Machtkampf mit Firmenchef Sculley verlassen. Quelle: dpa
Zum Durchbruch verhalf der grafischen Benutzeroberfläche nicht Steve Jobs, sondern ein junger Bursche namens Bill Gates. Sein Startup Microsoft entwickelte für den Computerhersteller IBM das Betriebssystem MS-DOS. In den 80er Jahren entdeckte Gates beim damaligen Partner Apple die intuitive Bedienung per Maus und ließ daraufhin die Benutzeroberfläche Windows entwickeln, die später Bestandteil aller Systeme wurde. 1985 kam die erste Version heraus, die ersten großen Erfolge gelangen in den 1990er Jahren mit Windows 3.0 und Windows 3.1. Heute ist Microsoft ein Software-Gigant und Windows der Quasi-Standard auf PCs. Quelle: dpa
Windows 95 bedeutete für Microsoft den Durchbruch – spätestens seit der Präsentation im namensgebenden Jahr 1995 kam kein Computerhersteller mehr an dem Betriebssystem vorbei. Damals führte der Software-Konzern auch den Start-Button ein, über den heute Millionen von Nutzern Programme aufrufen oder auch den Rechner ausschalten. Weitere Meilensteine in der Entwicklung sind Windows XP (2001) und Windows 7 (2009). Aktuell vermarktet Microsoft Windows 8. Quelle: dpa
Steve Jobs verhalf nicht nur der grafischen Benutzeroberfläche zum Durchbruch, sondern auch dem Touchscreen: Nach seiner Rückkehr zu Apple ließ er das iPhone entwickeln – hier die Präsentation im Januar 2007. Es war zwar nicht der erste Handy mit berührungsempfindlicher Oberfläche, hatte aber dank seiner intuitiven und ruckelfreien Bedienung so viel Erfolg wie kein Gerät zuvor. Für damalige Verhältnisse war das revolutionär, heute ist es Standard. Denn Apple fand viele Nachahmer. Quelle: AP
Auch im iPod Touch setzte Apple später seinen Touchscreen ein. Inzwischen kommt die Technologie in immer mehr Geräten zum Einsatz, auch in Notebooks oder Uhren. Quelle: AP

Auch Universitätsvorlesungen führen, von Fachvokabular abgesehen ("Ammoniumcyanat"), zu brauchbaren Mitschriften. Allerdings heißt „brauchbar“ nicht „perfekt“. Pro Textseite sollte der Anwender etwa zehn Minuten Nachbearbeitung einplanen. Wer will, kann die Texte direkt auf Linguatecs Web-Seite redigieren und sich bei Unklarheiten den entsprechenden Ausschnitt der Aufnahme synchron anhören.

Doch auch Voice Pro hat Grenzen. Wenn mehr als ein Sprecher auf der Aufnahme zu hören ist, versagt die Selbstoptimierung des Sprachprofils oftmals. Da verhält es sich beim Online-Dienst nicht anders als beim Dragon-Sprechertraining am PC. Die Folge: Das Interview mit Fußball-Bundestrainer Joachim Löw oder der Mitschnitt des historischen Kanzler-Duells Schröder gegen Stoiber werden zwar transkribiert. Aber sie brauchen einigen nachträglichen Feinschliff. Meist geht das zumindest schneller, als alles von Hand abzutippen.

Es zeigt sich aber auch, wie stark die Erkennungs- von der Aufnahmequalität abhängt. Per Handy aufgezeichnete Interviews bringen das Programm leichter aus dem Tritt als professionell ausgesteuerte Gesprächsmitschnitte. Dann gelingen Voice Pro zwar einerseits auch vom Reporter-Mitschnitt komplexe Transkriptionen: Worte wie "Sondergenehmigung" oder "Europa League" werden richtig erfasst. Andererseits produziert die Software Sinnlos-Syntax, wenn sie etwa statt "wieder richtig gut" ein "widerliches Blutbad" hört.

Ohne ausgiebige Nachbearbeitung sind diese Interviews kaum lesbar. Für Langsam-Schreiber mag die Korrigiererei schneller gehen, als selbst zu tippen - Spaß aber macht sie nicht.

So bleibt nach dem Test ein gemischtes Bild. Linguatecs Voice Pro Enterprise kann tatsächlich schnell und sprecherunabhängig brauchbare Transkriptionen liefern. Doch mit der Zahl der Sprecher steigt auch die Fehlerzahl. Die Rede des Vorstandsvorsitzenden dürfte der Software deshalb keine Probleme machen; das Protokoll eines hitzigen Aufsichtsratsmeetings wird einiges an Nachbearbeitung benötigen.

Damit auch das demnächst der Vergangenheit angehört, forscht der Aachener Sprachforscher Ney gerade an Szenarien, in denen sich Sprecher auch mal ins Wort fallen. Im Rahmen des Projekts Gale, das vom US-Verteidigungsministerium finanziert wird, arbeitet seine Gruppe unter anderem an einer Technik, die chinesische Fernsehdebatten transkribiert und ins Englische übersetzt.

In Arbeit
Bitte entschuldigen Sie. Dieses Element gibt es nicht mehr.

An 100-prozentig zuverlässige Spracherkennung glaubt aber auch Informatiker Ney in absehbarer Zeit nicht. Wo Menschen beteiligt sind, gebe es immer auch Sonderlinge - in der Szene despektierlich "Goats" genannt: Sprecher, die ohne erkennbaren Grund von der Software partout nicht verstanden werden.

Zwar lag ihr Anteil vor zehn Jahren noch bei etwa einem Fünftel, heute nur noch im einstelligen Prozentbereich. Doch ganz verschwinden werden die "Ziegen" wohl nie.

Jetzt auf wiwo.de

Sie wollen wissen, was die Wirtschaft bewegt? Hier geht es direkt zu den aktuellsten Beiträgen der WirtschaftsWoche.
Inhalt
Artikel auf einer Seite lesen
Zur Startseite
Diesen Artikel teilen:
  • Artikel teilen per:
  • Artikel teilen per:
© Handelsblatt GmbH – Alle Rechte vorbehalten. Nutzungsrechte erwerben?
Zur Startseite
-0%1%2%3%4%5%6%7%8%9%10%11%12%13%14%15%16%17%18%19%20%21%22%23%24%25%26%27%28%29%30%31%32%33%34%35%36%37%38%39%40%41%42%43%44%45%46%47%48%49%50%51%52%53%54%55%56%57%58%59%60%61%62%63%64%65%66%67%68%69%70%71%72%73%74%75%76%77%78%79%80%81%82%83%84%85%86%87%88%89%90%91%92%93%94%95%96%97%98%99%100%