Universelle Anti-Spam-Lösung am Horizont?

Der Kampf gegen den Wiki-Spam

Der folgende Beitrag ist vor 2021 erschienen. Unsere Redaktion hat seither ein neues Leitbild und redaktionelle Standards. Weitere Informationen finden Sie hier.

Wikis klingen wie eine gute Idee aus den guten alten Tagen des Netzes: Alle tun sich zusammen und schreiben hilfreiche Texte über dies und das: vom Lexikonartikel bis zur Anleitung für Computerprogramme, vom Protokoll des letzen Meetings bis zur next action-Liste für das aktuelle Projekt. Dabei ist die Idealvorstellung, dass – außer in Intranets – der Zugang zum Wiki absolut frei sein sollte, will heißen: Jede und jeder kann auf den Link Diese Seite ändern klicken und genau das tun: Aspekte hinzufügen, Tippfehler korrigieren und Links aktualisieren. Und das auch noch, ohne sich mit HTML-Tags herumschlagen zu müssen.

Was wie ein Märchen klingt, provoziert auch den bösen Wolf: Es dauerte nicht lange, bis hochkompetente Internet-Marketer (andere nennen sie „Spammer“) bemerkten, dass Wikis oft gute Bewertungen bei Suchmaschinen genossen und bei der Anzeige ganz oben auf der Trefferliste auftauchten. Und da Suchmaschinen wiederum für Links von Seiten mit hohem Page-Rank der Zielseite ebenfalls einen Bonus zukommen lassen und zudem häufig verlinkte Seiten zusätzlich belohnen, lag nichts näher, als diesen Wikis einen Besuch abzustatten und sie mit Hyperlinks auf die eigenen und einschlägigen „Dienstleistungen“ zu versehen: Online-Casinos, Vergrößerung primärer Geschlechtsmerkmale und all die anderen schönen Dinge, die wir schon aus unserer Spam-E-Mail kennen.

Während bei E-Mail die einen filtern und die anderen es für vollkommen ausreichend halten, die Löschtaste zu drücken, ist bei Wikis der Vorgang komplexer: Wikis speichern zwar in der Regel frühere Versionen einer Seite, so dass man problemlos den vorhergehenden Zustand wiederherstellen kann, aber dieser Hindernislauf wird bei dem Besuch mehrerer Wikispammer täglich und dutzenden geänderten oder gar neu erzeugten Seiten mit Werbelinks zur zeitraubenden Reparaturaktion. Wikis, deren Betreuer sie verwaisen lassen, verkommen langsam zum Werbe-Link-Dschungel.

Es geht um den Pagerank in Suchmaschinen

Webinhalte, die Suchmaschinen zu freundlichen Platzierungen überreden sollen, sind nicht neu. Zunächst waren es sogenannte „Brückenseiten“, die Surfer anlocken und dann auf die eigentliche Homepage weiterleiten sollten, dann Linkfarmen – untereinander vernetzte Homepages, die sich gegenseitig durch Links in höhere Listenregionen wuchten – und dann der Kommentar-, Referrer- und Trackback-Spam in Weblogs der dafür sorgt, dass ein Link zur beworbenen Webseite in den ebenfalls von Google und Yahoo freundlich behandelten Blogs auftaucht.

Wie gehen die Spammer nun vor? Wenn der Wikibetreiber Glück hat, ist „nur“ ein manueller Spammer am Werk, der Wikis ansurft und unauffällig oder auffällig seine Link-Fracht ablegt. Doch selbst nach dem Rückgängigmachen der Änderungen liegen die Links noch auf den Vorversionen der Wikiseite und bringen dem Übeltäter Google-Punkte. Sie auch von dort zu entfernen ist in der Regel mühsame Handarbeit.

Wenn der Wiki-Spammer hingegen bestimmte Wikitypen gezielt ansurft, wie Wiki-Eigner Lars Gregori kürzlich vermutete und automatisierte Skripte nicht nur Spam abwerfen sondern gelegentlich ganze Netzwerke aus neuen Seiten erzeugen, dann wird es mühsam – und wie Gregori schließen manche die betreffenden Wikis für andere Nutzer ganz.

Maßnahmen gegen Wiki-Spammer

Die einfachste Gegenmaßnahme ist: Nur Leute im Wiki schreiben lassen, die man kennt, oder die sich mit Namen und E-Mailadresse identifizieren. Das ist eine Lösung, die aber spontane Korrekturen oder Hinzufügungen zu Seiten schwieriger macht und damit nicht zur Wiki-Philosophie des „offenen Zugangs für jeden“ passt.

Sogenannte captchas sollen ebenfalls verhindern, dass Maschinen mit Skripten in den Wikis pfuschen: vor gemusterten Hintergründen finden sich schiefe Buchstaben und Zahlen, die dann als Passwort eingetippt werden müssen. Doch diese sind für Sehbehinderte genauso eine Hürde, wie für die Skripte. Einfache Quizfragen oder Mathematikaufgaben gelten eher als barrierefreier Spamschutz, werden aber selten benutzt.

Nur begrenzt erfolgreich ist es, bestimmte IPs oder IP-Nummerbereiche, die einzelne Server oder Provider kennzeichnen, vom Schreibzugriff auf das Wiki auszuschließen, denn damit wird auch manchem Unbeteiligten der Schreibzugang verwehrt.

Änderungen werden unübersichtlich

In der Wikipedia – dem weltweit bekanntesten und größten Wiki – ist Spam kaum ein Problem, denn dort sorgt ein ganzes Geschwader von menschlichen Korrektoren für Ordnung und nur sehr selten muss eine IP-Sperre verhängt werden. Dort sind eher in Artikel eingeschmuggelte unauffällige Verweise eine Werbeform, die vom Redaktionskollektiv beobachtet wird.

Eine intelligente Lösung ist ein Skript, das die Änderungen anderer Skripte erkennt und rückgängig macht. Hier ist aber die sonst nützliche Wikiseite mit den „letzten Änderungen im Wiki“ nutzlos, denn inmitten der Änderungswut der einander bekämpfenden Skripte fallen die Änderungen der echten Menschen kaum noch auf.

An der Wurzel setzen Spamschutz-Einrichtungen an, die schon vor dem Abspeichern der „bösen Links“ deren URLs mit schwarzen Listen vergleichen. Das Elegante daran: Solche Schwarzen Listen werden zunächst von den einzelnen Wikiadministratoren angelegt und „nach oben“ zu einer Zentralliste durchgereicht, die dann auch allen anderen Administratoren zu Gute kommt. So gehandhabt bei der Wiki-Geschmacksrichtung MoinMoin. Dort setzt man auch Blocklisten aus der Weblog-Welt ein (die von „Movable Type“) und benutzt gar Listen mit „offenen Servern“, die gleichermaßen für Mailspam und Wiki-Spam missbraucht werden.

Am Horizont zeichnet sich damit vielleicht sogar eine universelle Anti-Spam-Lösung für das ganze Netz ab: Spammer nutzen immer Lücken im System – wenn die abgedichtet werden, kann man Mail- und Webspam mit der selben „Dichtungstechnik“ bekämpfen. Und die Provider selbst wollen auch keine Spammer als Kunden, denn die erzeugen für wenig Geld nur Arbeit, teuren Traffic und wuchten unbeteiligte andere Kunden auf schwarze Listen.

Die Zerstörungswut der Killer-Skripte

Die Spammer zerstören mittlerweile nicht nur Wikis: Während mancher von E-Mail-Spam Geplagte vor einigen Monaten noch propagierte, man solle ihm doch bitte über sein Forum eine private Mitteilung senden, tun exakt dieses nun die Spammer: So reaktiviert ein Bot gerade die früheren Leser des Internet-Forums der Zeitschrift Sat & Kabel: Sie erhalten plötzlich massenhaft E-Mails vom Webmaster, es liege eine private Nachricht für sie vor, grübeln dann längere Zeit über ihr Passwort – es handelt sich ja um eine „private, vertrauliche Nachricht“, die sich nicht so einfach ohne vorherigen Login abrufen lässt –, lassen sich schließlich ein neues Passwort geben, nur um dann festzustellen, dass sie sich für Werbemüll eine halbe Stunde herumgeplagt haben.

Ebenso schalten immer mehr Blogs ihre Kommentarfunktion ab und verlieren so die Interaktivität mit den Lesern, nicht, weil die Diskussionen der User überhand nehmen (Bloggers Anonymous), sondern weil die Spambots und die dagegen eingesetzten Anti-Spam-Skripte den Server überlasten. Falls Spam und Viren nicht bereits über den Bloghoster eingeschleust werden. Und einige der übelsten Spambots wie der berüchtigte „Texas Holdem Poker“ müssen gar absolut überall das letzte Wort haben.

Einen gewissen Schutz scheint es auch zu bieten, wenn man seltene Wikisoftware einsetzt: Beate Palands BeWiki benutzt die japanische Pukiwiki-Software und ist vollkommen frei von Attacken durch Spam-Skripte.

Die Gästeliste eines von Technorati initiierten und von Yahoo als Gastgeber betreuten Web Spam Squash Summit Ende Februar 2005 jedenfalls liest sich interessant: Amazon, Ask Jeeves, Feedster, Google, Project Honey Pot, Technorati, Yahoo, AOL, Blojsom, Buzznet, Microsoft, PGP Corporation, dazu die Bloganbieter Six Apart, UserLand und WordPress. Außerdem waren auch Wiki-Interessierte vertreten.

Ursprünglich hatte man die Konferenz per Video und IRC im Netz abbilden wollen, doch dann darauf verzichtet, damit auch und vor allem marketing-unerfahrene Techniker sich auf der Konferenz offen über Probleme mit Spammern in ihren Diensten austauschen konnten. Und selbst bei den anwesenden Webloggern finden sich nur bruchstückhaft Erwähnungen über das dort Diskutierte. Man will eventuell dem „Feind“ nicht zu früh verraten, welche Lösungen man sich ausgedacht hat.

Die Zeit der ganz offenen Wikiplattformen scheint aber vorbei: Stephan Mosel, der das nur für registrierte Schreiber zugängliche Plastic-Thinking-Wiki betreibt, formulierte in einem IRC-Chat zur Wiki-Situation einen Satz, der wohl zum geflügelten Wort werden wird:

Offene Wikis sind echt so was von 2004.