"Alles eine Frage der Skalierung"

Forscher bei IBM arbeiten an Systemen, die aus aktuellen Geschäftsdaten konkrete Handlungsanweisungen für Firmen erstellen können.

In Pocket speichern vorlesen Druckansicht 5 Kommentare lesen
Lesezeit: 5 Min.
Von
  • Tom Simonite

Forscher bei IBM arbeiten an Systemen, die aus aktuellen Geschäftsdaten konkrete Handlungsanweisungen für Firmen erstellen können.

In Unternehmen fallen immer mehr digitale Daten an, sich durch smarte Algorithmen verarbeiten lassen. Das führt nicht selten zu Ergebnissen, auf die menschliche Analysten allein womöglich nie kämen. Chid Apte, Leiter des Bereiches "Analytics Research" beim IT-Riesen IBM, steht einem Team vor, das solche Lösungen erarbeiten soll. Die Gruppe entwickelt Software, die aus Datenbergen konkrete Rückschlüsse auf Problemlösungen zieht. Im Interview mit Technology Review erläutert Apte, wie weit die Technik heute ist.

Technology Review: IBM baut und verkauft seine Datenanalyse-Produkte bereits seit Jahrzehnten. Gibt es Neues in diesem Segment?

Chid Apte: Historisch gesehen ging es dabei stets um die Verarbeitung ordentlich aufbereiteten Datenmaterials aus den vergangenen Monaten, das den Firmen in strukturierter Form vorlag. Nun haben wir zwei neue und ganz andere Datenquellen. Der eine Bereich sind unstrukturierte Daten aus Kundeninteraktionen wie E-Mails an den Kundensupport oder Mitschriften von Kundengesprächen. Der andere Bereich sind soziale Informationen, die wir aus dem Web holen können – die Welt von Twitter und anderen "Feeds". Meine Gruppe arbeitet direkt mit Kunden zusammen, um diese Datenquellen besser nutzen zu können. Dabei geht es darum, echte Probleme zu lösen, die ein Unternehmen bewältigen möchte.

TR: Können Sie ein konkretes Beispiel für ein solches Projekt nennen?

Apte: Wir arbeiteten mit einem Verbrauchsgüterhersteller, der Sportgetränke vertreibt. Die Firma wollte wissen, wie ihr Produkt wirklich ankommt, welche Gefühle die Kunden gegenüber dem Getränk entwickeln. Wir bauten also eine Technik, mit der sich beispielsweise Blogs extrahieren ließen, die sich mit solchen Produkten beschäftigten. Anschließend haben wir die Gespräche rund um das konkrete Getränk analysiert. Wir konnten so eine Bewertung vornehmen und herausfinden, wer zur Gruppe der "Influencer", also der Social-Media-Nutzer mit bedeutender Stimme, gehört. Wir konnten so diejenigen Personen finden, die eine Firma am besten ansprechen müsste, um ihre Botschaft in den Social Networks zu verteilen. Die bei dem Projekt entwickelte Technik stellt die Basis eines neuen Produktes dar, das wir in Zukunft auch allen großen IBM-Kunden anbieten werden.

TR: Können Ihre Analysesysteme mehr als nur das Interpretieren von Zahlen?

Apte: Wir haben bereits Systeme entwickelt, die dem Nutzer sagen können, was die richtige Entscheidung wäre. Dabei wird das sogenannte Reinforcment Learning und der Markovsche Entscheidungsprozess verwendet. Ein IBM-System, das das Finanzministerium des US-Bundesstaates New York einsetzt, nutzt diese Idee bereits. Es generiert automatisch Vorschläge, wie mit einzelnen Steuerschuldnern umgegangen werden sollte.

Dabei wird ermittelt, wie man die maximale Summe bei minimalen Kosten wieder hereinholen kann. Wenn man so ein System trainiert, schaut es sich Daten nicht wie eine große Tabelle an. Stattdessen wird eine Sequenz aus Entscheidungsmöglichkeiten in Graphenform gepackt. Von da aus lässt sich dann ein optimaler Handlungsplan entwickeln.

TR: Was ist mit Algorithmen, wie sie beim "Jeopardy"-Gewinner Watson eingesetzt wurden? Das System erlaubt es unter anderem, direkte Fragen zu stellen, wie man es von Computern bislang nicht kannte.

Apte: Hier sehen wir viele Chancen für etwas, das wir "Deep QA" nennen. Watson wurde hauptsächlich von einem Forscherteam entwickelt, das bei IBM versucht, Computer natürliche Sprache verstehen zu lassen. Die Kollegen haben aber eng mit meinem Team zusammengearbeitet, was das maschinelle Lernen anbetrifft. Diese Entwicklung wird weitergehen.

Die Grundlagentechnik von Watson basiert aus einem großen, unstrukturierten Corpus an Daten, den wir auch nutzen wollen. Im Geschäftsbereich könnte man traditionellere Analysemethoden mit solchen Deep QA-System zusammenbringen. Daran arbeiten wir.

TR: Was ist in nächster Zeit die größte Herausforderung für den Bereich der Datenanalyse?

Apte: Wir brauchen dringend bessere Methoden, große Datenmengen zu verarbeiten. Früher haben sich vielleicht ein paar Internet-Firmen mit Petabytes an Daten herumschlagen müssen, nun findet so etwas auch in normalen Konzernen statt. Telekomfirmen haben detaillierte Gesprächsdaten vorliegen, Regierungsorganisationen ebenfalls gigantische Infomengen. Gesundheitsfirmen konsolidieren Patientendaten. Statt ein paar Dutzend Faktoren zu analysieren, begeben wir uns in einen Bereich mit Hunderten von Einzelfragestellungen, die wir auch noch gleichzeitig verarbeiten.

Wir entwickeln gerade eine ganz Infrastruktur für diese neue Welt. Dazu gehören Architekturen für verteiltes und paralleles maschinelles Lernen, die ganz neue Hardware auch ausnutzen können. Es ist alles eine Frage der Skalierung. (bsc)