DNS-Algorithmus gegen Spam

Ein IBM-Algorithmus zur Mustersuche in DNS-Sequenzen erkennt auch Spam. Treffergenauigkeit: 97 Prozent.

22.08.2004, 16:32 Uhr

Lesezeit: 1 Min.

Von

Gerald Himmelein

Den Teiresias-Algorithmus hatten IBM-Forscher ursprünglich entwickelt, um DNS-Stränge und Aminosäuren nach wiederkehrenden Mustern zu durchsuchen. Mit etwas Tuning haben Wissenschaftler am New Yorker Thomas J. Watson Research Center den DNS-Durchsucher jetzt zum Spam-Spürhund umkonfiguriert. Der in "Chung-Kwei" umbenannte Algorithmus wurde mit 65 000 Spam-Nachrichten gefüttert, die er dann mit normalen Mails verglich, um die in beiden Gruppen vorkommenden Muster auszusieben.

Den Forschern zufolge weist der Filter eine Trefferquote von 96,56 Prozent auf und ordnete dabei nur eine von 6000 Nachrichten fälschlicherweise als Spam ein. Auf einem Pentium 4 mit 2,2 GHz verarbeitete Chung-Kwei laut Isidore Rigoutsos und Tien Huynh pro Sekunde 214 Nachrichten. In Werbe-Mails häufig vorkommende Zeichen-Ersetzungen wie V!agra und $ex berücksichtigt der Suchalgorithmus durch dieselben Routinen, nach denen Teiresias einander ähnliche DNS-Sequenzen wiedererkannte. Details zum Vorgehen des Filters finden sich in der detaillierten Beschreibung [PDF-Link]. Mittelfristig plant IBM, den Mechanismus auch in seinen Spam-Filter SpamGuru zu integrieren, der Bestandteil der nächsten Version von Lotus Workplace Messaging werden soll. (ghi)