Wächter am Telefon
Eine neue von Microsoft Research entwickelte Software soll so genannten "Voice Spam" abhalten.
- Duncan Graham-Rowe
Forscher bei Microsoft haben eine neue Technik entwickelt, mit der sich Telefonanrufe überprüfen lassen. Die Idee: Unerwünschte Werbegespräche so genannter "Voice Spam", soll den Nutzer gar nicht mehr erreichen. Die Software analysiert dabei die Stimme des Anrufers und seinen Wortschatz, um herauszufinden, ob der Anruf wirklich dringend ist. Außerdem soll sich so erkennen lassen, ob der Anrufer ein Freund, ein Familienmitglied, Kollege oder Fremder ist. Dann wird das Gespräch entweder durchgestellt oder auf die Mailbox umgeleitet.
Getauft hat Microsoft Research die Technik "V-Priorities", was schlicht für "Sprachprioritäten" steht. Ursprünglich war das System dafür gedacht, sicherzustellen, dass wichtige Gespräche auch dann Personen erreichen, wenn diese beschäftigt oder in einem Meeting sind. Erfinder Eric Horvitz, der die Technik im Hauptquartier von Microsoft Research in Redmond entwickelte, erkannte jedoch schnell, dass sich "V-Priorities" auch als Filter für Voice Spam verwenden lässt.
In ersten Tests erreichte ein Prototyp eine Genauigkeit von 90 Prozent - das System erkannte zuverlässig, ob ein Anruf unerwünscht war oder nicht. Ähnlich gute Erkennungsraten gab es bei der Unterscheidung von Freunden, guten Bekannten und anderen Personen (84 Prozent) sowie bei der Prüfung, ob es sich um geschäftliche oder persönliche Gespräche handelte (75 Prozent).
Bill Keller, Computerwissenschaftler an der University of Sussex, hält die Erkennung solcher Informationen aus einer Sprachmitteilung für nicht besonders schwer. Der Spezialist für Natural Language Processing kennt gar bereits Programme, die in Call Centern eingesetzt werden, um zu prüfen, ob ein Anrufer sich aufregt. Das Londoner Softwareunternehmen Corpora will ebenfalls erste Erfolge bei der Erkennung der Stimmungslage von Anrufern vorweisen können.
Raimund Genes, Technologiechef beim Anti-Viren-Spezialisten Trend Micro in München, hält Voice Spam zwar derzeit noch für ein recht selten vorkommendes Problem. Mit der wachsenden Verfügbarkeit von Internet-Telefonie mittels Voice over IP dürfte sich das Problem jedoch verstärken, wie er meint - die Kosten solcher Anrufe werden immer geringer.
Außerdem: VoIP macht solche Werbeanrufe nicht nur billiger und einfacher, sondern bietet neue Angriffsvektoren etwa auf VoIP- basierte Telefonanlagen von Großunternehmen, wie Scott Sobers, Service Provider-Spezialist bei IBM Tivoli, meint. In Zukunft könnten solche Netze gar für neue Arten von Computerviren und andere Schadsoftware anfällig sein, die sich allein durch die Annahme derartiger Anrufe ins eigene Netz einschleppen lassen - was heutzutage noch nach Science Fiction klingt.
Auch in Deutschland wird an entsprechenden Projekten gearbeitet. In dem Projekt SPIT-AL (Spam over Internet Telephony-Abwehr-Lösung), erarbeitet beispielsweise der Kieler Internet-Provider TNG AG mit Unterstützung durch das Unabhängige Landeszentrum für Datenschutz Schleswig-Holstein (ULD) eine "rechtskonforme Lösung" für das Problem. Ob eine Analyse der Gesprächsinhalte nach deutschem Recht nämlich überhaupt zulässig ist, ist durchaus fraglich sagt Jan Möller vom ULD: "Juristisch betrachtet kann ein Eingriff in das Telekommunikationsgeheimnis vorliegen, wenn Telekommunikationsanbieter Inhalte der Kommunikation über das zur Erbringung des Telekommunikationsdienstes hinaus erforderliche Maß zur Kenntnis nehmen". Zwar sei ihm bislang noch kein Urteil oder Fachaufsatz bekannt, in dem diese Frage diskutiert worden sei, aber eine ähnliche Argumentation habe es im Fall von Anti-Spam Software bereits gegeben.
"V-Priorities" setzt laut Microsoft-Forscher Horvitz auf drei Ebenen. Die erste analysiert die so genannte Prosodie, also Rhythmus, Silbenanzahl, Tonhöhe und Pausenlänge der Anruferstimme. Die zweite Ebene setzt eine rudimentäre Wort- und Satz-Erkennung ein, um bestimmte Zielwörter zu erkennen, die die Natur des Anrufes verraten könnten. Das sei ein einfacher wie effizienter Ansatz, wie Horvitz meint: "Wie häufig sagt Ihre Frau denn schon "Mein Name ist..." zu Ihnen?" Die dritte Analyseebene setzt schließlich auf "Metadaten", also beispielsweise, wann der Anruf erfolgte und wie lange die Botschaft ist. "All diese Dinge greifen ineinander."
Der Maschinenlern-Algorithmus, der im noch recht einfachen Prototypen von "V-Priorities" arbeitet, wurde bislang mit 207 verschiedenen Sprachnachrichten trainiert, die von einem einzigen Angestellten stammten, der sie in einem Zeitraum von acht Monaten erhielt. Die Mailbox wurde von den Forschern zunächst aus Einfachheitsgründen verwendet. In der Endversion soll "V-Priorities" hingegen echte Live- Anrufe entgegennehmen können und den Anrufer dann bitten, sich zu identifizieren. Danach wird entschieden, ob er durchgelassen oder auf die Mailbox umgeleitet wird.
Es ist das gleiche Prinzip wie beim so genannten "Challenge-Response"- System, das manche Nutzer als E-Mail-Spam-Schutz verwenden. Hier muss der Absender erst einmal eine weitere Frage beantworten, bis seine Mail tatsächlich den Empfänger erreicht. "Bei Mails funktioniert das sehr gut", meint Trend Micro-Mann Genes, muss aber zugeben, dass viele Nachrichtenversender dies umständlich und recht nervig finden.
Es gäbe bereits einige dieser Challenge-Response-Systeme auch für die Vorauswahl von Anrufen, meint IBM Tivoli-Vertreter Sobers. Diese seien allerdings noch nicht automatisiert und bedeuteten, dass der Angerufene erst die Aufzeichnung des Anrufers abhören müsse, in der sich dieser ausweise. Danach lässt sich dann entscheiden, ob man das Gespräch annehmen will oder nicht.
Die Überprüfung der übermittelten Rufnummer (Caller-ID) sei natürlich noch eine weitere Möglichkeit, meint Microsoft-Forscher Horvitz. Doch viele Firmen und einzelne Bürger blockierten diese. Zudem sei nicht immer allein der Anrufer dafür ausschlaggebend, ob man ein Gespräch annehme. So könne es sein, dass man nur dann mit einem Kollegen sprechen wolle, wenn es dringend sei, weil sich dieser beispielsweise verspäte. Dazu könne das System dann automatisiert nach Worten wie "ich komme zu spät", "viel Verkehr" oder "Zug verpasst" lauschen.
Trend Micro-Experte Genes gibt unterdessen zu bedenken, dass Challenge-Response-Systeme bei E-Mail womöglich weniger effizient sind als bei Telefonaten. Es sei recht einfach, eine solche Software zu übertölpeln, in dem man beispielsweise so tue, als kenne man die Person. Auch kumpelhafte Sprache ließe sich zum Schein einsetzen..
Gleichzeitig könnte der Voice Spam künftig auch von billigen Arbeitskräften aus Entwicklungsländern kommen und nicht vom Band. Dagegen seien heutige Werbeanrufe noch gar nichts. "V-Priorities" könnte also bereits an einem schlaueren Anrufer scheitern. "Wenn jemand Sie unbedingt erreichen will, wird er einen Weg finden", meint Genes.
Übersetzung: Ben Schwan. (wst)