Home » Durchbruch geschafft: Es lebe die Spracherkleckung!

Durchbruch geschafft: Es lebe die Spracherkleckung!

Wann haben Sie zum ersten Mal gelesen, dass der große Durchbruch in der Spracherkennung unmittelbar bevorstehe? Oder dass er sogar schon erfolgt sei? War das vor fünf, zehn oder gar schon fünfzehn Jahren?

23.05.2003

Haben Sie die Visionen mit verfolgt und gelesen, dass wir schon in Kürze nicht nur mit dem Computer, sondern auch mit Haushaltsgeräten sprechen, anstatt Tasten zu drücken?

Und was ist davon bisher Realität? Bei manchen Handies wird die richtige Nummer gewählt, wenn man den Namen des gewünschten Gesprächspartners ins Mikrofon spricht. Und vielleicht sind Sie ja einer der wenigen Glücklichen, bei denen die Sprach-Computer-Bahnauskunft versteht, wohin sie reisen wollen.

Und sonst? Spracherkennung hat weder vor fünfzehn, zehn oder fünf Jahren vernünftig und praxisnah funktioniert, noch tut sie es heute.

Sie finden dieses Urteil zu pauschal? Sicher, es gibt vielleicht die eine oder andere Laborsituation, in der sich ganz passable Ergebnisse erzielen lassen. Was die Umschreibung passabel im Einzelfall bedeutet, hängt jedoch schon wieder stark von der individuellen Leidensfähigkeit des Anwenders ab.

Das glauben Sie nicht? Es gibt Beweise: Ein der Redaktion bekannter Manager wollte noch effektiver arbeiten und kaufte zum Diktiergerät mit Festspeicher eine passende Software. »Unterwegs ins Diktiergerät sprechen und zuhause sofort Textdateien erhalten«, so lautete das Produktversprechen. Als nach mehreren nächtlichen PC-Sitzungen — denn tagsüber hat man ja Besseres zu tun — schließlich die zugehörige Software installiert war und funktionierte, zeigte sich, dass die erzeugten Dateien riesig, die Übertragung und Verarbeitung entsprechend langsam waren.

Die größte Nervenprobe sollte aber noch folgen: Die »Anpassung« der Software an die individuelle Sprachfärbung. Nur wer mit einem unerschütterlichen Glauben an Fortschritt und Technik gesegnet ist, der führt nach den ersten enttäuschenden Ergebnissen noch umfangreiche Tests in lauten und leisen Räumen, mit billigen und teuren Mikrofonen durch, weil er zuerst den Fehler bei sich sucht. So weit dürften die Allermeisten schon gar nicht mehr kommen.

Die Belohnung für so viel Mühe: Prinzipiell funktioniert es. Aber nur die wenigsten würden wohl aus dem folgenden Beispiel rückschließen können, was sie wirklich gesprochen hatten: »Spracherkleckung Test. Diesen Texten vollem von sehr gesprochen Soldat dreißig Zentimeter Abstand das Netz zum und blieb Hintergrundgeräusche von Schimpansen, dem Fernseher, dem wir trinken, sonstiger.« Nach vielen Stunden unnützer Arbeit ist das nur mit sehr viel Humor zu ertragen.

»Kann nicht sein, liegt am Diktiergerät«, sagt da der Verkäufer. »Einzelfälle, wenn billige Software verwendet wird«, pflichtet der Entwickler bei. »Das System ist intelligent, es lernt permanent dazu. Sie müssen es für einen längeren Zeitraum benutzen, schon nach wenigen Tagen erzielen Sie bessere, fast fehlerfrie Ergebnisse«, steht im Beiblatt. »Fehlerfrie« statt »fehlerfrei«, das hätte schon zu Denken geben müssen: Wusste der Texter des Beiblatts um die Qualität des Produkts und wollte den Käufer heimlich warnen?

Aber vielleicht stimmen die positiven Aussagen ja: Wenn man eine Woche am Stück mit dem System arbeitet und zum Diktieren ungestört in einem vollkommen ruhigen Büro ganz nah vor dem Rechner sitzt, kann die Software vielleicht anschließend einen tollen Job machen. Und wenn man dabei noch absolut druckreif formuliert, ist der Text dann auch direkt nach dem Diktieren schon fertig.

Aber das sind eben einfach zu viele Bedingungen: So bleibt die Spracherkennung bis auf weiteres praxisfremd und weitgehend sinnfrei.

Das soll kein Plädoyer gegen den Einsatz neuer Technologien sein. Aber wenn im Einzelfall der Durchbruch seit fünfzehn Jahren unmittelbar bevorsteht, darf man schon ein bißchen skeptisch werden, oder? Aber das nächste Newsroom- oder Archivsystem, der nächste Camcorder mt Spracherkennung, sie kommen garantiert.

Sie werden sehen.

Kommentar Top-Story

Autor: C. Gebhard, G. Voigt-Müller

MagentaTV: Die WM schläft nie – die Regie auch nicht

02.07.26

Broadcast Solutions übernimmt BFE

09.07.26

Neue Maßstäbe in der Virtual Production

16.07.26

Broadcast Defense 4: Phishing im Mediensektor

26.06.26

NEP verlängert Wimbledon-Deal

09.07.26

Arri trennt sich von Rental Business

13.07.26

Tests

Kopfhörer-Test: Sony MDR-MV1

18.06.2026

Praxistest: Kompakte DJI-Drohnen Lito 1 und Lito X1

11.06.2026

Praxistest: DJI Osmo Pocket 4

21.05.2026

Load More Posts

26.-28. August

IBC

Führende Veranstaltung für Content und Technologie in der Medienbranche.

Amsterdam

11. bis 14. September

MTH Conference

Die MediaTech Hub Conference ist eine führende internationale Boutique-Veranstaltung.

Potsdam

29. bis 30. September

Imaging World

Das Festival für Foto, Film und Content Creation.

Nürnberg

2. bis 4. Oktober

CABSAT

CABSAT wurde 1993 gegründet und hat sich zu einer etablierten Veranstaltung für die Medien- und Kommunikationsbranche in der MEASA-Region (Naher Osten, Afrika, Südasien) entwickelt

Dubai

5. bis 7. Oktober

LEaT con 26

Mit 140 Speakern bot die letzte LEaT con ein beeindruckendes Programm aus Vorträgen und Workshops.

Hamburg

6. bis 8. Oktober

Cookie	Dauer	Beschreibung
cookielawinfo-checkbox-advertisement	1 year	WebToffee: Erfasst die Einwilligung fuer die Kategorie 'Werbung'.
cookielawinfo-checkbox-analytics	1 year	WebToffee: Erfasst die Einwilligung fuer die Kategorie 'Analyse'.
cookielawinfo-checkbox-necessary	1 year	WebToffee: Erfasst die Einwilligung fuer die Kategorie 'Notwendige Cookies'.
CookieLawInfoConsent	1 year	WebToffee: Speichert die kategorienweise Einwilligung des Besuchers.
PHPSESSID	session	Serverseitige Session-ID zur Aufrechterhaltung des Nutzerzustands; sofern Sessions genutzt werden.
viewed_cookie_policy	1 year	WebToffee: Speichert, ob der Besucher dem Cookie-Banner zugestimmt hat.
wordpress_logged_in_*	session	WordPress: Haelt die Anmeldung angemeldeter Nutzer (Redaktion) aufrecht.
wordpress_sec_*	session	WordPress: Sicherheits-Cookie fuer angemeldete Nutzer ueber HTTPS.
wp-settings-*	1 year	WordPress: Speichert Oberflaechen-Einstellungen angemeldeter Nutzer im Adminbereich.

Cookie	Dauer	Beschreibung
_pk_id.*	13 months	Matomo: Eindeutige Besucher-ID zur Wiedererkennung wiederkehrender Besucher.
_pk_ref.*	6 months	Matomo: Speichert die Herkunftsquelle (Referrer) des Besuchers.
_pk_ses.*	30 minutes	Matomo: Kurzlebiges Cookie fuer Daten der aktuellen Sitzung.

Cookie	Dauer	Beschreibung
VISITOR_INFO1_LIVE	6 months	YouTube: Steuert die Wiedergabe eingebetteter Videos und dient der Reichweitenmessung.
YSC	session	YouTube: Sitzungs-ID zur Erfassung von Aufrufen eingebetteter Videos.

Durchbruch geschafft: Es lebe die Spracherkleckung!

Most Popular

MagentaTV: Die WM schläft nie – die Regie auch nicht

Broadcast Solutions übernimmt BFE

Neue Maßstäbe in der Virtual Production

Broadcast Defense 4: Phishing im Mediensektor

NEP verlängert Wimbledon-Deal

Arri trennt sich von Rental Business

Newsletter

Tests

Kopfhörer-Test: Sony MDR-MV1

Moments Lab bringt KI-gestützte Videosuche in lokale Archive

TERMINE

Ufa Filmnächte

IBC

MTH Conference

Imaging World

CABSAT

LEaT con 26

Jobs

Programmierer* Mesh-Technologie in Vollzeit (m/w/d)

Technischer Assistent* in Vollzeit (m/w/d)

Elektroingenieur* in Vollzeit (m/w/d)

Get in touch

Legal

SERVICES

Know more

Durchbruch geschafft: Es lebe die Spracherkleckung!

Ähnliche Beiträge:

Most Popular

Newsletter

Keep in Touch

Get in touch

Legal

SERVICES

Know more