Audio-Captchas: Die meisten lassen sich knacken

Störgeräusche in Audio-Captchas sollen zwar die automatische Erkennung verhindern. Mit besonderen Verfahren lassen sich die gesprochenen Zeichen jedoch ausfiltern. Ein Ausnahme bildet Googles reCAPTCHA.

In Pocket speichern vorlesen Druckansicht 91 Kommentare lesen
Lesezeit: 2 Min.
Von
  • Daniel Bachfeld

Ein Forscherteam der Universität Stanford hat ein System entwickelt, mit dem sich die Audio-Captchas vieler Anbieter in einem wirtschaftlichen Rahmen knacken lassen. Captchas (Completely Automated Public Turing Test to Tell Computers and Humans Apart) dienen als Schutz vor automatischen Skripten zum Anlegen von Mail-Konten und sollen Spammer ausbremsen. Bei normalen Captchas wird eine beliebige Zeichenfolge oder ein Textfragment eingeblendet, die der Anwender erkennen und eingeben muss. Skripte tun sich damit mehr oder minder schwer.

Um Barrierefreiheit zu gewährleisten, gibt es alternativ Audio-Captchas, bei denen die einzugebenden Zeichen und Ziffern per Audiodatei übermittelt – also vorgelesen – werden. Um automatischen Spracherkennungssystemen die Arbeit zu erschweren, werden dem Audiosignal Rauschen und andere Störgeräusche beigemischt.

Nach Angaben der Forscher reicht das jedoch nicht aus, um die automatische Erkennung zuverlässig zu stören. Ihre selbst entwickelte Software Decaptcha filtert Störgeräusche aus, separiert die vermutlichen Zeichen und Ziffern und erkennt sie nach einer Trainingsphase mit einer 50-prozentigen Wahrscheinlichkeit. Die Forscher benutzen dazu diverse Verfahren und Algorithmen, die sie in dem Dokument "The Failure of Noise-Based Non-Continuous Audio Captchas" (PDF) beschreiben. Gegen die von ihnen entwickelten Verfahren böten beispielsweise Microsoft und Yahoo Spammern nur noch wenig Widerstand.

Ein Ausnahme ist nach Angaben der Forscher Googles reCAPTCHA: Dort wird zwischen den Ansagen der einzelnen Zeichen im Hintergrund ständig gebrabbelt und erzählt (Semantic Noise), was Decaptcha durcheinanderbringt. Die Forscher empfehlen Anbietern von Audio-CAPTCHAS, weiter in diesem Feld zu forschen, um die Verfahren robuster zu machen. (dab)