Was Text- und Spracherkennungsprogramme taugen
Text- und Spracherkennung ist alltagstauglich geworden, meint das IT-Magazin iX.
- JĂĽrgen Seeger
Text- und Spracherkennungssoftware sind inzwischen reif für den Büroeinsatz. Texterkennungsprogramme liefern mit einem handelsüblichen Multifunktionsgerät und einer Auflösung von 300 dpi gute Leistungen. Bei der komplexeren Spracherkennung sorgen umfangreiche Trainingsdatensätze und entsprechende Wörterbücher für stimmige Ergebnisse, schreibt das IT-Magazin iX in der aktuellen Ausgabe 2/09.
Die Erkennungsergebnisse der gängigen Texterkennungs- oder OCR-Programme unterscheiden sich nur geringfügig. Die konkreten Werte hängen deutlich von der jeweils gewählten Vorlage ab, sodass man keine allgemeingültigen Erfolgsquoten angeben kann. Laserausdrucke in gängigen Schriftarten setzen die Programme normalerweise fast fehlerfrei um, bei exotischen Schriften und schlechten Vorlagen steigt die Fehlerquote. Bei den 300-dpi-Scans zeigte keines der getesteten Programme ernsthafte Schwächen, berichtet iX. Wer für die automatisierte Verarbeitung von handschriftlich ausgefüllten Formularen auf eine akzeptable Fehlerquote angewiesen ist oder aber Frakturschrift verarbeiten muss, wird sich aber nicht mit Standardsoftware zufriedengeben, sondern zu speziellen Softwarelösungen greifen.
Auch moderne Spracherkennungsprogramme sind mittlerweile erwachsen geworden. Ăśberdeutliches und langsames Sprechen ist heute nicht mehr erforderlich. Nach entsprechendem Training der Software kann der Anwender ganz normal reden.
Der Funktionsumfang aktueller Software erlaubt nicht allein das Diktieren von Texten, sondern eine ganze Palette von Anwendungen, von der sprachgesteuerten Computernutzung bis hin zum kompletten Transkriptions-Workflow in Kanzleien, Kliniken oder anderen Unternehmen. Speziell bei den erstgenannten Anwendungen wird regelmäßig viel diktiert, weshalb die Hersteller hier auch Fachvokabular etwa für Mediziner und Anwälte anbieten.
Im Artikel werden die Produkte Dragon Naturally Speaking, Macspeech Dictate und Voice Pro (Spracherkennung) sowie Finereader, OmniPage Professional, ReadRris Pro, IRISpdf und Recognition Server (OCR) näher betrachtet. Die aktuelle iX ist ab heute im gut sortieren Zeitschriftenhandel oder ohne Versandkosten per Online-Bestellung erhältlich. (js)