Kommentar, Top-Story: 23.05.2003

Durchbruch geschafft: Es lebe die Spracherkleckung!

Wann haben Sie zum ersten Mal gelesen, dass der große Durchbruch in der Spracherkennung unmittelbar bevorstehe? Oder dass er sogar schon erfolgt sei? War das vor fünf, zehn oder gar schon fünfzehn Jahren?

Haben Sie die Visionen mit verfolgt und gelesen, dass wir schon in Kürze nicht nur mit dem Computer, sondern auch mit Haushaltsgeräten sprechen, anstatt Tasten zu drücken?

Und was ist davon bisher Realität? Bei manchen Handies wird die richtige Nummer gewählt, wenn man den Namen des gewünschten Gesprächspartners ins Mikrofon spricht. Und vielleicht sind Sie ja einer der wenigen Glücklichen, bei denen die Sprach-Computer-Bahnauskunft versteht, wohin sie reisen wollen.

Und sonst? Spracherkennung hat weder vor fünfzehn, zehn oder fünf Jahren vernünftig und praxisnah funktioniert, noch tut sie es heute.

Sie finden dieses Urteil zu pauschal? Sicher, es gibt vielleicht die eine oder andere Laborsituation, in der sich ganz passable Ergebnisse erzielen lassen. Was die Umschreibung passabel im Einzelfall bedeutet, hängt jedoch schon wieder stark von der individuellen Leidensfähigkeit des Anwenders ab.

Das glauben Sie nicht? Es gibt Beweise: Ein der Redaktion bekannter Manager wollte noch effektiver arbeiten und kaufte zum Diktiergerät mit Festspeicher eine passende Software. »Unterwegs ins Diktiergerät sprechen und zuhause sofort Textdateien erhalten«, so lautete das Produktversprechen. Als nach mehreren nächtlichen PC-Sitzungen — denn tagsüber hat man ja Besseres zu tun — schließlich die zugehörige Software installiert war und funktionierte, zeigte sich, dass die erzeugten Dateien riesig, die Übertragung und Verarbeitung entsprechend langsam waren.

Die größte Nervenprobe sollte aber noch folgen: Die »Anpassung« der Software an die individuelle Sprachfärbung. Nur wer mit einem unerschütterlichen Glauben an Fortschritt und Technik gesegnet ist, der führt nach den ersten enttäuschenden Ergebnissen noch umfangreiche Tests in lauten und leisen Räumen, mit billigen und teuren Mikrofonen durch, weil er zuerst den Fehler bei sich sucht. So weit dürften die Allermeisten schon gar nicht mehr kommen.

Die Belohnung für so viel Mühe: Prinzipiell funktioniert es. Aber nur die wenigsten würden wohl aus dem folgenden Beispiel rückschließen können, was sie wirklich gesprochen hatten: »Spracherkleckung Test. Diesen Texten vollem von sehr gesprochen Soldat dreißig Zentimeter Abstand das Netz zum und blieb Hintergrundgeräusche von Schimpansen, dem Fernseher, dem wir trinken, sonstiger.« Nach vielen Stunden unnützer Arbeit ist das nur mit sehr viel Humor zu ertragen.

»Kann nicht sein, liegt am Diktiergerät«, sagt da der Verkäufer. »Einzelfälle, wenn billige Software verwendet wird«, pflichtet der Entwickler bei. »Das System ist intelligent, es lernt permanent dazu. Sie müssen es für einen längeren Zeitraum benutzen, schon nach wenigen Tagen erzielen Sie bessere, fast fehlerfrie Ergebnisse«, steht im Beiblatt. »Fehlerfrie« statt »fehlerfrei«, das hätte schon zu Denken geben müssen: Wusste der Texter des Beiblatts um die Qualität des Produkts und wollte den Käufer heimlich warnen?

Aber vielleicht stimmen die positiven Aussagen ja: Wenn man eine Woche am Stück mit dem System arbeitet und zum Diktieren ungestört in einem vollkommen ruhigen Büro ganz nah vor dem Rechner sitzt, kann die Software vielleicht anschließend einen tollen Job machen. Und wenn man dabei noch absolut druckreif formuliert, ist der Text dann auch direkt nach dem Diktieren schon fertig.

Aber das sind eben einfach zu viele Bedingungen: So bleibt die Spracherkennung bis auf weiteres praxisfremd und weitgehend sinnfrei.

Das soll kein Plädoyer gegen den Einsatz neuer Technologien sein. Aber wenn im Einzelfall der Durchbruch seit fünfzehn Jahren unmittelbar bevorsteht, darf man schon ein bißchen skeptisch werden, oder? Aber das nächste Newsroom- oder Archivsystem, der nächste Camcorder mt Spracherkennung, sie kommen garantiert.

Sie werden sehen.