Was Kunden wirklich wollen
Software durchforstet Geschäftsdokumente und Online-Äußerungen nach interessanten Datenschnipseln, die Firmen helfen sollen.
- Tom Simonite
Eine neuartige Software durchforstet Geschäftsdokumente und Online-Äußerungen nach interessanten Datenschnipseln, die Firmen helfen könnten.
Aus dem kulturwissenschaftlichen Blickwinkel betrachtet ist das "Social Web" mit seinen zahllosen digitalen Netzwerken eine weitgefasste Arena menschlicher Ausdrucksform und Kooperation. Aus dem geschäftlichen Blickwinkel ergibt sich jedoch ein ganz anderes Bild: Die Möglichkeit, wertvolle Erkenntnisse zum Konsumentenverhalten zu erhalten – und Wünsche und Sehnsüchte von Otto Normalverbraucher "in freier Wildbahn" zu erleben.
Entsprechend interessiert sind Unternehmen mittlerweile an solchen Daten. Das Problem: Wo viel Signal ist, ist auch viel Rauschen. Collective Intellect, ein Text-Mining-Spezialist aus Boulder, Colorado, ist eine der High-Tech-Firmen, die dabei helfen wollen, aus Postings auf Twitter, Facebook, MySpace, Blogs oder Foren das zu extrahieren, was über Produkte gesagt wird. Die Software des Start-ups nutzt dazu eine Suite mit Algorithmen aus dem Bereich des maschinellen Lernens, um Texte zu scannen und zu ermitteln, worum es einer Äußerung geht und welche emotionale Tonlage sie hat.
Statt nur wie Google und Co. hauptsächlich eine Stichwortsuche durchzuführen, geht es Collective Intellect um die Bedeutung einzelner Wörter. "Das Wort "Apple" ist ein gutes Beispiel", sagt Technikchef Greg Greenstreet, "es steht für eine Technologiefirma, aber auch für eine Frucht." Die Software versucht daher, zwischen Begriffseinordnungen zu unterscheiden, indem weitere Verwendungsformen eines Wortes in einem unterschiedlichen Kontext untersucht werden. Ergebnis sollen Textbewertungen und Assoziationen sein, die denen eines menschlichen Benutzers ähneln. "Wenn ich "Steve Jobs" sage, weiß sowohl eine Person als auch unsere Software, über welche Firma wir hier reden."
Der Einsatz der Collective-Intellect-Software beginnt mit der Definition einiger Suchbegriffe. Das Werkzeug gibt dann verschiedene Ergebniscluster zurück, die vom Nutzer akzeptiert oder abgewiesen werden können, um dem System beizubringen, was er wissen will. Jemand, der sich für die Konsumenteneinschätzung zur Schuhmarke "Crocs" interessiert, wählt dann Cluster ab, die mit Krokodilen zu tun haben und erlaubt die, die sich um Fußbekleidung drehen. Danach sucht Collective Intellect nach Diskussionen, die mit dem definierten Thema zu tun haben. Darüber erhält der Benutzer dann regelmäßig einen detaillierten Report. Über ein Online-Dashboard lässt sich außerdem die Posting-Aktivität über eine Zeitachse verfolgen und das Volumen positiver, neutraler oder negativer Beiträge ermitteln.
Die Senderkette MTV ist ein Beispiel für die neue Strategie zur Konsumentendurchleuchtung, die ein solches Werkzeug möglich macht. "Traditionelle Marktforschung ist zu langsam für eine solche Firma", sagt Greenstreet. Das Medienunternehmen wolle wissen, was die Zuseher genau in dem Moment dachten, wenn Person X aus "Jersey Shore" einen auf die Nase bekam. Das Online-Geplauder über TV-Sendungen eröffne zudem neue Werbemöglichkeiten, sagt Greenstreet. "Ich kann beispielsweise einem Reinigungsmittelunternehmen beweisen, dass die Leute, die eine bestimmte Show betrachten, sich für ein bestimmtes Produkt interessieren."
Collective Intellect untersucht inzwischen aber auch Daten außerhalb der offenen Netze – etwa Anrufmitschriften von Call-Centern oder Mitschnitte von Arztkonsultation. "In diesem Fall will dann ein Pharmahersteller wissen, welche Themen diskutiert wurden, während ein Patient ein Medikament verschrieben bekam." Greenstreet glaubt, dass solche Werkzeuge in Zukunft immer häufiger auf interne Daten angewendet würden. "Es gibt sehr viele Informationen bei Firmen, die diese derzeit gar nicht kontrollieren können."
David Steier, Direktor fĂĽr den Bereich Informationsmanagement bei der Consulting-Firma Deloitte in Palo Alto, glaubt ebenfalls, dass viele Unternehmen auf wertvollen Datenhaufen sitzen. Er und sein Team arbeiten deshalb an automatisierten Systemen, die die interessantesten Informationsberge anbohren sollen, was sonst in Handarbeit schlicht nicht ginge.
"Autoversicherungen besitzen beispielsweise Unfallhergänge in Textform, die bislang von einem Angestellten studiert und interpretiert werden mussten. Wir haben eine Software, die liest den Text und andere Informationen auf dem Formular, um einen Risikowert automatisch zu bestimmen." Dazu wurde das System zunächst mit händisch bearbeiteten Formularen gefüttert, um maschinell zu lernen. Darüber wurden dann Worte erfasst, die besonders teure Unfälle signalisieren. "Motorrad" und "geflogen" gehören dazu, denn Zweirradunfälle, bei denen der Betroffene per Hubschrauber ins Krankenhaus gebracht wird, sind in der Regel nicht kostenarm.
"Man kann den von uns gefundenen Risikowert dann verwenden, um komplexe Vorfälle an die Versicherungsmitarbeiter mit der größten Erfahrung weiterzuleiten", sagt Steier. Ein ähnlicher Ansatz lässt sich auch zum Analysieren von Unterstützungsanfragen an eine Hotline nutzen. Dabei wird anhand von Mitschriften analysiert, wie hoch die Wahrscheinlichkeit ist, dass ein Kunde sich einem konkurrierenden Produkt zuwendet. Dann können entsprechende Gegenmaßnahmen eingeleitet werden, etwa auf ihn zugeschnittene Sonderangebote. "Die Firmen müssen auf die Tatsache achten, dass in ihren unstrukturierten Daten sehr viel Wertvolles liegen kann. Das wird bislang leicht übersehen", sagt Steier. (bsc)