Auf der Suche nach dem nächsten Bankenskandal
Eine US-Firma hat eine Software entwickelt, die mit Data-Mining-Verfahren und maschinellem Lernen in der geschäftlichen Kommunikation Anzeichen von Betrugsfällen ausmachen soll.
- Jessica Leber
Eine US-Firma hat eine Software entwickelt, die mit Data-Mining-Verfahren und maschinellem Lernen in der geschäftlichen Kommunikation Anzeichen von Betrugsfällen ausmachen soll.
In einem durchschnittlichen Geldhaus werden pro Jahr zwischen einer und drei Millionen E-Mails ausgetauscht – wenn nicht sogar mehr. Mittendrin in diesem Datenhaufen voller Marketingpläne, Zahlenkolonnen und Memoranden können sich potenziell auch Nachrichten verbergen, die Verdachtsmomente für kommende wie aktuelle kriminelle Machenschaften liefern.
Die US-Firma Digital Reasoning will Banken nun helfen, diese kritischen Informationen aufzufinden, bevor es zu spät ist. Dazu hat sie eine Software entwickelt, die mit Hilfe von Algorithmen aus dem Bereich des maschinellen Lernens problematische Inhalte automatisch auffinden können soll – und zwar aus unstrukturierten Text-Daten, die neben E-Mails auch Twitter-Botschaften oder Bürodokumente sein können. Das Verfahren nutzt statistische Modelle, um Satzteile herunterzubrechen und ihre Bedeutung abzuleiten. Dieser semantische Ansatz ist wichtig, weil es nicht ausreicht, einfach nur nach Schlüsselbegriffen zu suchen.
Die Firma will Banken außerdem helfen, von dem ständig wachsenden geschäftlichen Datenvolumen zu profitieren, das derzeit noch kaum analysiert wird. Immer mehr Firmen sehen darin eine Art Rohstoff, der wertvolle Informationen enthält – solange man ihn sich erschließen kann, auch wenn das eventuell auf Kosten der Privatsphäre der Mitarbeiter geht.
Digital Reasoning wurde vor 12 Jahren gegründet und hat bereits mit Geheimdiensten und der US-Armee zusammengearbeitet, die die Software 2010 in Afghanistan einsetzte, um Rohdaten und Protokolle auszuwerten. Laut CEO Tim Estes reichte es dort beispielsweise aus, nach dem Namen eines Kämpfers zu suchen, um dann alle seine Aliasnamen sowie Verbindungen zu anderen Personen und Terrorgruppen darzustellen. Die Daten ließen sich auch auf eine Karte bringen. Digital Reasoning hat offenbar gute Regierungskontakte: Die Firma erhielt unter anderem Gelder von In-Q-Tel, dem Risikokapitalarm der CIA.
Digital-Reasoning-Chef Estes hofft, dass nun auch Banken und andere Finanzinstitutionen seine Software kaufen. Nach einigen Monaten, in denen er sich mit IT-Chefs von einigen der größten Geldhäuser der Welt traf, sieht er ein großes Bedürfnis für sein Produkt.
Wie immer geht es um das liebe Geld: Finanzfirmen könnten potenziell Milliarden sparen, wenn sie Betrug, problematische Beratungsansätze oder Insiderhandel seitens der Mitarbeiter früher entdecken. Ein Beispiel ist die Investmentbank Goldman Sachs. Anhörungen im US-Senat zeigten, dass dort vor der Finanzkrise 2008 schon mal E-Mails ausgetauscht wurden, in denen sich Angestellte brüsteten, Kunden schlechte Anlagen verkauft zu haben. Estes sagt, dass seine Software solches Verhalten frühzeitig der Compliance-Abteilung der Bank hätten melden können.
Cris Conde, langjähriger früherer Chef der IT-Firma SunGard, der Firmen im Finanz-Software-Bereich berät und auch Digital Reasoning unterstützt, hält ein solches Produkt für überfällig. Überraschenderweise seien die Banken weit hinten, was die Auswertung der vielen Terabyte an Informationen anbelangt, die sich nicht in Tabellen packen oder zur Optimierung des Handelsgeschäftes nutzen lassen.
Digital Reasoning verwendet spezielle Trainingsalgorithmen, um Massen von E-Mails und anderen Textdaten "lesen" und in Sinneinheiten zerlegen zu können. Anschließend werden Wörter und Satzteile in organisierte Beziehungen zueinander gesetzt, die dann im Kontext verglichen werden können. Diese Daten lassen sich wiederum durchsuchen oder alternativ nutzen, um automatisch Alarmsignale auszulösen.
HP, Microsoft, IBM und Oracle haben ähnliche Textanalyseprogramme entwickelt, doch organisieren diese normalerweise komplette Dokumente basierend auf bestehenden Regeln. Außerdem müsse ein Mensch oft dem System helfen, sobald eine Dokumentengruppierung erfolgt sei, meint Estes. Digital Reasoning will dagegen sofort relevante Textdaten und Verbindungsmuster anzeigen – als ob der Nutzer selbst die Daten schon durchgegangen wäre. Das soll bestenfalls nur wenige Minuten dauern. Noch kann die Firma allerdings keinen Großkunden nennen. (bsc)