Polyglotter Müll-Filter: SpamAssassin 4.0 beherrscht mehr Sprachen

Das Open-Source-Werkzeug SpamAssassin bekommt mit Version 4.0 drei neue Plugins – und erkennt Spam-Mails künftig nicht mehr nur auf Englisch zuverlässig.

In Pocket speichern vorlesen Druckansicht 1 Kommentar lesen
Lesezeit: 2 Min.

Der Open-Source-Spam-Filter SpamAssassin ist in Version 4.0 erschienen. Das erste Major-Release seit rund 18 Jahren enthält drei neue Plugins und verbessert die Spracherkennung in einigen Bereichen. Außerdem gibt es eine Reihe weiterer kleiner Verbesserungen und Fixes.

Das erste neue Plugin heißt ExtractText. Es ermöglicht den Einsatz externer Software, um Textinhalte aus Dateianhängen von E-Mails per OCR (Optical Character Recognition) zu extrahieren. So können eingestellte SpamAssassin-Regeln auch auf Anhänge angewendet werden.

IX NEWSLETTER: MONATLICH SPANNENDE HINTERGRÜNDE ZUR NEUEN AUSGABE

Kennen Sie schon den kostenlosen iX-Newsletter? Jetzt anmelden und monatlich zum Erscheinungsdatum nichts verpassen: heise.de/s/NY1E In der nächsten Ausgabe geht's ums Titelthema der Januar-iX: Cloud-Datenbanken.

Ein weiteres Plugin implementiert die Domain-based Message Authentication, Reporting and Conformance-Spezifikation (DMARC). Das letzte neue Plugin, DecodeShortURLs, tut das, was sein Name nahelegt: Es erkennt gekürzte Links. Wie der Mailinglisten-Eintrag zum Release erläutert, kennt SpamAssassin "eine Liste von URL-Abkürzungsservices" – welche, darüber schweigt der Eintrag. Die Software erkennt eigenständig die gekürzten Links und kommuniziert mit den Diensten. Anschließend fügt es die erkannten Links in die Liste der extrahierten URLs hinzu. Dort können Anwenderinnen und Anwender Regeln und Plugins wie URIDNSBL einsetzen. Das bereits in den letzten Versionen von SpamAssassin nicht mehr weiterentwickelte HashCash-Modul wurde in Release 4.0 nun gänzlich entfernt.

Eine weitere große Neuerung ist die Verfügbarkeit der Spam-Erkennung nicht-englischer Inhalte; unter anderem über UTF-8-Regeln, die SpamAssassin jetzt nativ verarbeitet. Auch das Bayes-Plugin zur Erkennung der Spam-Wahrscheinlichkeit hat das Team überarbeitet, damit es künftig auch mit Füllwörtern anderer Sprachen zurechtkommt. Alle Neuerungen listen die Release-Notizen in der SpamAssassin-Mailingliste.

Das Entwicklungs-Team versichert dort zudem, man habe das neue Release bereits ausführlich in Produktivsystemen getestet. Ein möglichst zeitnahes Upgrade sei daher allen streng angeraten, die Arbeiten am bisherigen Entwicklungszweig SpamAssassin 3.4 würden ab sofort eingestellt. Version 3.0.0 von SpamAssassin erschien 2004. Seitdem gab es jedoch einige Minor Releases, zuletzt Version 3.4.6 im April 2021. Das Open-Source-Werkzeug ist ein beliebtes Mittel zur Abwehr von Spam in Unternehmen, bei Internet-Providern und anderen Organisationen.

Siehe auch:

(jvo)