_

Spracherkennung: Sonne, Wind und Diktiergerät

von Mehmet Toprak

Spracherkennung am PC funktioniert inzwischen so gut, dass sich viele Anwender fragen, ob das auch mit einem Diktiergerät klappen könnte. Die Idee dahinter: Unterwegs diktieren, den Rest besorgt die Software auf dem Rechner. Ein Selbsttest.

Wie von Geisterhand: Dragon Naturally Speaking 11 setzt die Audioaufnahme Zeile für Zeile in einen Text um.
Wie von Geisterhand: Dragon Naturally Speaking 11 setzt die Audioaufnahme Zeile für Zeile in einen Text um.

Die völlige Freiheit vom PC verspricht der Hersteller Nuance mit der Kombination aus dem Spracherkennungsprogramm Dragon Naturally Speaking und einem Diktiergerät. Ein extrem reizvoller Gedanke für alle, die häufig längere Texte schreiben und nicht gerne stundenlang am Schreibtisch sitzen. Bequem auf dem Sofa fläzen oder im Garten in die Sonne blinzeln und dabei seine Gedanken in einen Voicerekorder sprechen, das wär´s.

Anzeige

Die so entstandene Audio-Datei wird via USB-Kabel auf die Festplatte des PCs kopiert. Dann verwandelt Dragon Naturally Speaking die Aufnahme Zeile für Zeile in einen Text. Währenddessen trinkt man in Ruhe einen Tee. Schöne Idee, aber funktioniert das überhaupt? Ja, es funktioniert, und zwar erstaunlich gut. Selbst das Diktat während eines flotten Herbstspaziergangs liefert fast so hohe Erkennungsraten, als säße man direkt vor dem Bildschirm und spräche ins Headset-Mikrofon. Allerdings sollte der Anwender dafür schon Erfahrung mit der Spracherkennung am PC haben und beim mobilen Diktat einige Regeln beachten.

Tascam DR-07: Exzellente Erkennung im Innenraum, bei unruhiger Umgebung tauchen mehr Fehler auf, da sich die Richtcharakteristik des Mikrofons nicht auf die Diktatsituation einstellen lässt. Quelle: Tascam
Tascam DR-07: Exzellente Erkennung im Innenraum, bei unruhiger Umgebung tauchen mehr Fehler auf, da sich die Richtcharakteristik des Mikrofons nicht auf die Diktatsituation einstellen lässt. Quelle: Tascam

Das beginnt schon mit der Wahl des Diktiergeräts. Um herauszufinden, welcher Typ sich am besten eignet, habe ich fünf Modelle ausprobiert. Den Philips Voicetracer 7630, ein einfaches Gerät, das nur Basisfunktionen bietet, aber immerhin so gut ist, dass es der Vorgängerversion von Dragon Naturally Speaking beigelegt war. Den Sony ICD-SX800, ein extrem kompakter Hightech-Rekorder, der mit drei eingebauten Mikrofonen angeblich auch Aufnahmen in CD-Qualität macht. Der Sony protzt außerdem mit einer "Fünf-Sterne-Zertifizierung" für Dragon. In der gleichen Liga spielt der Olympus DM-550, der im Zusammenspiel mit einem externen Mikrofon auch fünf Dragon-Sterne bekommt.

Philips Voicetracer 7630: Im Home Office ohne Umgebungsgeräusche gute Leistung, im Outdoor-Einsatz nur bei ruhiger Umgebung gut. Quelle: Philips
Philips Voicetracer 7630: Im Home Office ohne Umgebungsgeräusche gute Leistung, im Outdoor-Einsatz nur bei ruhiger Umgebung gut. Quelle: Philips

Daneben habe ich mir auch zwei hochwertige tragbare PCM-Rekorder vorgenommen, den Olympus LS-5 und den Tascam DR-07. Diese Rekorder sind größer und schwerer als typische Diktiergeräte. Sie sind eher dafür gedacht, Musik oder Naturgeräusche aufzunehmen oder Podcasts zu produzieren. Doch gerade wegen der erstklassigen Aufnahmequalität und der semiprofessionellen Features könnten sie eine Alternative zu den Diktiergeräten sein. Sind sie auch, da aber typische Funktionen wie beispielsweise die Aktivierung der Aufnahme durch die Stimme fehlen, sind der Tascam und der Olympus LS-5 für unseren Zweck letztendlich nicht optimal.

Für meine Probediktate habe ich Texte aus unterschiedlichen Themenfeldern und unterschiedlicher Schwierigkeitsgrade gewählt: Geschäftliche und private E-Mails, einen Artikel aus Wiwo.de über die Börse, zwei Musikrezensionen und einen Weblog für Jogger. Der Wortschatz wurde in Dragon Naturally Speaking vorher trainiert. Es galt herauszufinden, ob Texte, die Dragon am PC fast fehlerlos schreibt, auch via Diktiergerät fast fehlerlos auf dem Bildschirm erscheinen. Deshalb sind die im Test erzielten Erkennungsraten natürlich besser, als bei einem "frischen Diktat", das auch neue Vokabeln enthält, die das Spracherkennungsprogramm noch nicht kennt. In solchen Fällen können Sie in der Praxis von Erkennungsraten zwischen 95 und 97 Prozent ausgehen.

weitere Fotostrecken

Blogs

Die Geldklammer - Gastbeitrag von Frank Dopheide zur Serie "Aussterbende Insignien der Macht"
Die Geldklammer - Gastbeitrag von Frank Dopheide zur Serie "Aussterbende Insignien der Macht"

Teil 8 – Die silberne Geldklammer. Geld regiert die Welt, das war so und das bleibt so. Nur das Geld verändert seine...

Wirtschaftswoche

Inhalt

Abo

eMagazin

iPad

Deutsche Unternehmerbörse - www.dub.de
DAS PORTAL FÜR FIRMENVERKÄUFE
– Provisionsfrei, unabhängig, neutral –
Angebote Gesuche




.