Forscher: KI sorgt fĂĽr effektiveres Phishing
Wie wirksam ist per LLM automatisch erzeugtes Phishing? Es ist gleichauf mit menschlich erzeugtem Spear-Phishing, sagen Forscher.
In einer Untersuchung der Effektivität von automatisch mit großen Sprachmodellen (Large Language Models, LLMs) erzeugten Phishing-Angriffen sind Forscher zu dem Ergebnis gekommen, dass die Künstliche Intelligenz ebenso effizient ist wie von Menschen personalisiertes Phishing. Gegenüber beliebigen, nicht gezielt erzeugtem Phishing sehen sie eine 3,5-fach höhere Effizienz.
Die Studie findet sich auf arxiv.org. Die Forschergruppe hauptsächlich eines Instituts der Harvard-Universität hat die Phishing-Angriffe mit 101 Teilnehmern getestet. Es ging dabei darum herauszufinden, wie gut es LLMs schaffen, personalisierte Phishing-Attacken – sogenanntes Spear-Phishing – auszuführen.
KI sehr effizient beim Phishing
Die Ergebnisse ĂĽberraschen. Die 101 Teilnehmer wurden in vier Gruppen eingeteilt. Die Kontrollgruppe erhielt beliebiges, nicht personalisiertes Phishing. Eine Gruppe bekamm von LLMs erzeugte Phishing-Mails zu sehen. Von Menschen gezielt erstellte Phishing-Mails gingen an eine dritte Gruppe und schlieĂźlich gab es noch eine Gruppe, die Spear-Phishing erhielt, bei dem Menschen Feinschliff an den von der KI erzeugten Mails vornahmen.
Die Forscher haben gemessen, wie oft auf Links in diesen Mails geklickt wurde. Das beliebige Phishing kam auf eine Klickrate von 12 Prozent. Links in voll automatisiert erzeugten KI-Phishing-Mails wurden in 54 Prozent der Fälle geklickt – genau so oft wie bei gezielten, von Menschen erstellten Phishing-Mails. Sofern Menschen noch mal Hand an das KI-Phishing legten, konnte eine leichte Steigerung der Klickrate auf 56 Prozent beobachtet werden.
Um gezieltes Phishing zu erzeugen, hat die Gruppe ein KI-gestütztes Tool erstellt, das den digitalen Fußabdruck der anvisierten Personen auswertet und darauf basierend personalisierte E-Mails erstellt – und den Erfolg der Betrugsstrategie im Anschluss bewertet. In 88 Prozent der Fälle konnte die KI dabei nützliche Informationen zu den Zielpersonen finden. Ihr Tool unterstützt mehrere LLMs, für ihre Untersuchung hat die Gruppe sich jedoch hauptsächlich auf den Einsatz von Claude 3.5 Sonnet und GPT-4o beschränkt.
Außerdem haben die Forscher überprüft, wie gut die fünf LLMs Claude 3.5 Sonnet, GPT-4o, Mistral, LLama 3.1 und Gemini Phishing-Mails erkennen können. Davon blieben am Ende als vielversprechendste Kandidaten Claude 3.5 Sonnet und GPT-4o übrig. An einem größeren Datensatz von 363 Phishing-Mails und 18 legitimen Nachrichten lieferte Claude 3.5 Sonnet eine Erkennungsrate von 97,25 Prozent und hatte keine falsch positiven Treffer. Die Forscher gehen davon aus, dass sie diese Ergebnisse mit Prompt-Tuning noch verbessern könnten. KI kann somit offensichtlich nicht nur zur Erzeugung, sondern auch zur Filterung von Phishing dienen.
KI-gestĂĽtztes Phishing ist nicht nur ein theoretischer Forschungsfall. In der vergangenen Woche haben der britische Versicherungskonzern Beazley und weitere Unternehmen vor immer mehr "hyper-personalisierten" Phishing-Mails gewarnt, die mithilfe von KI-Generatoren verfasst werden.
(dmk)