Tempel, Türken, Telephone

Etwas Geschichtserkennung: Ein kleiner Blick in die Historie von Spracherkennung und Sprachsynthese.

05.07.2019, 06:00 Uhr

Lesezeit: 3 Min.

Von

Peter Glaser

Die Idee der Spracherkennung findet sich bereits in der Bibel als außergewöhnliche Fähigkeit, fremde Sprachen sprechen zu können, ohne sie gelernt zu haben. In der Apostelgeschichte wird berichtet, dass zu Pfingsten bei einem Tempelfest in Jerusalem der Heilige Geist auf die Apostel und ihre Begleiter herabkam und Festbesucher von weither sie daraufhin in ihrer jeweils eigenen Sprache sprechen hörten ("Die Leute, die da reden, sind doch alle aus Galiläa! Wie kommt es, dass jeder von uns sie in seiner Muttersprache reden hört?").

Technisch realisierbare Ansätze von Spracherzeugung zeichneten sich erst ein gutes Stück später ab. Um 1780 begann der k.k. Hofrat Wolfgang von Kempelen in Wien mit der Entwicklung einer Sprechmaschine, mit der sich die menschliche Stimme auf mechanischem Wege möglichst naturgetrau nachbilden lassen sollte. 1784 konnte das Gerät menschliche Sprachlaute bilden. Die bedeutende Leistung dieser ersten funktionstüchtigen Apparatur zur Sprachsynthese geriet aber durch einen anderen Automaten von Kempelens in Misskredit: den Schachtürken. Im Inneren dieses vermeintlichen Schachautomaten, der zwei Jahre lang ganz Europa begeisterte, bediente letztlich doch ein versteckter, kleinwüchsiger Mensch die Hebel.

1864 sagte der schottische Physiker James Clerk Maxwell die Existenz von Radiowellen vorher, die sein deutscher Fachkollege Heinrich Hertz 22 Jahre später experimentell bestätigen konnte. Im Jahr 1900 sendete der kanadische Erfinder Reginald Fessenden damit die erste Sprachnachricht der Welt. Von seiner Funkstation in Brant Rock aus nahm am Weihnachtsabend 1906 dann auch die erste drahtlose Sprach- und Musikübertragung – vulgo Rundfunksendung – ihren Lauf. Fessenden las die Weihnachtsgeschichte aus der Bibel vor und sang anschließend "Stille Nacht, heilige Nacht", wobei er sich auf der Violine begleitete.

1878 hatte Thomas Alva Edison das Patent auf ein Gerät erhalten, das im Unterschied zu vielen anderen seiner Erfindungen grundlegend neu war: den Phonographen, der die menschliche Stimme nicht nur wiedergeben, sondern auch aufzeichnen konnte (Wobei Edisons Verdienste als Erfinder nicht zuletzt darin bestanden, seine Innovationen marktfähig zu machen). An Geschäftstüchtigkeit auf Augenhöhe mit Edison, führte auch der britische Taubstummenlehrer Alexander Graham Bell Versuche zur Aufzeichnung von Schallwellen durch. Bell war schon früh von der menschlichen Stimme fasziniert, er bastelte beispielsweise eine Apparatur aus Gummi, Holz und Draht, die wie ein Baby schreien konnte.

Sein Wissen über Akustik half ihm, Gehörlosen beizubringen, wie sie sich artikulieren konnten – und, die Erfindung des Telefons für sich zu nutzen. 1876 war ihm (wie man heute weiß, auf fragwürdige Weise) das Patent für das Telefon zugesprochen worden, das sich als eines der lukrativsten jemals erteilten Patente erweisen sollte. 1925 wurden in New York die Bell Telephone Laboratories eröffnet, die Forschungsabteilung jenes Quasi-Monopols, das sich in den USA aus der 1877 gegründeten Bell Telephone Company entwickelt hatte.

Mitarbeitern der Bell Labs verdanken wir Dinge wie den Laser, die Solarzelle und den Transistor. 1952 entstand dort ein "Automatischer Ziffernerkenner" namens AUDREY ("Automatic Digit Recognizer"), der gesprochene Ziffern identifizieren konnte, indem er in dem Audiowellensalat nach akustischen Fingerabdrücken suchte (den Formanten). Nicht nur für die Sprachverarbeitung öffnete sich nun das Tor in die digitale Welt. 1956 tauchte anläßlich eines Workshops am Dartmouth College in New Hampshire erstmals der Begriff Künstliche Intelligenz auf. Der Rest ist Geschichte.

(bsc)