Datamining für alle

Pivot, eine neue Anwendung der Microsoft Live Labs, will die Visualisierung und das Durchsuchen von Datenmassen mit einer einfachen Benutzeroberfläche in den Mainstream holen.

In Pocket speichern vorlesen Druckansicht
Lesezeit: 4 Min.
Von
  • Erica Naone

Pivot, eine neue Anwendung der Microsoft Live Labs, will die Visualisierung und das Durchsuchen von Datenmassen mit einer einfachen Benutzeroberfläche in den Mainstream holen.

Es ist eine der brennenden Fragen unserer Zeit: Wie kann man aus den Datenmassen, die überall anschwellen, schnell sinnvolle Information gewinnen? Viele kluge Köpfe suchen seit Jahren nach einer befriedigenden Antwort. Einer von ihnen ist Gary Flake, Gründer und Direktor der Microsoft Live Labs, die neue experimentelle Webanwendungen entwickeln. Flakes Antwort ist „Pivot“, ein Werkzeug, das die Live Labs Anfang des Monats veröffentlicht haben.

Pivot bereitet Daten in Form einer Bildersammlung auf, die durch Texte ergänzt wird. Nimmt man zum Beispiel Daten aus der Wikipedia, werden diese in Briefmarken-große Bilder verwandelt. Ein Nutzer kann in diese Collage hereinzoomen, um ein einzelnes Bild genauer zu studieren, aber auch herauszoomen, um zu schauen, welche Bilder zu inhaltlich verwandten Gruppen angeordnet sind.

In Pivot können Nutzer in Bildsammlungen hineinzoomen.

(Bild: Microsoft Live Labs)



Die Grundidee ist zwar nicht neu. Flake hofft aber, dass die einfache graphische Darstellung von Pivot hilft, intuitiv Erkenntnisse aus den Daten zu gewinnen. Die konsistente Benutzeroberfläche mache die Stärke der Anwendung aus, sagt Flake. „Die Interaktion mit den Daten bewegt sich irgendwo zwischen Browsen und Suchen.“

Herzstück von Pivot ist die von Microsoft entwickelte Software Seadragon, mit der sich große Mengen an visuellen Daten verarbeiten lassen. Auch auf handelsüblichen Rechnern kann sie Grafik bruchlos vergrößern und zu verkleinern, ohne dass man erst das Nachladen abwarten muss. Vor fünf Jahren wäre Pivot noch nicht möglich gewesen, weil damals die graphische Datenverarbeitung von PCs noch nicht leistungsfähig genug war.

Flakes Gruppe bei Live Labs hat einige Beispielsammlungen angelegt, an denen Nutzer das neue Tool ausprobieren können. Um selbst eine Bildersammlung zu erstellen, müssen sie Graphikdateien zunächst ins Deep-Zoom-Format umwandeln. Mit dem arbeitet die Seadragon-Software. Im Webstandard XML können dann Zusatzinformationen angehängt werden. Dank des „Pivot Collection Tool“, eines Plug-ins für Microsoft Excel, lassen sich diese Zusätze auch ohne XML-Kenntnisse in der bekannten Tabellenverarbeitungssoftware verfassen.

Möglich sind sowohl statische Bildsammlungen als auch solche, die durch einen kontinuierlichen Datenstrom ergänzt werden. Ein Facebook-Nutzer etwa hat Pivot bereits dazu genutzt, die Beziehungen zwischen seinen Freunden in dem sozialen Netzwerk zu visualisieren.

Mit Hilfe der Anwendung können User auch Webseiten durchstöbern und organisieren. Weitere Funktionen wie eine Textsuche sollen demnächst integriert werden, kündigt Flake an. Damit könnte man dann besser als bisher Suchtreffer durchforsten – statt der typischen Liste von nur zehn Treffern könnten dann Tausende auf einen Schlag graphisch dargestellt werden. „Wir versuchen, das Web als ein physisches Web zu betrachten“, erläutert Flake den Ansatz hinter Pivot.

Auf der TED-Konferenz in Long Beach, Kalifornien, hat das Werkzeug bereits Aufsehen erregt. Für Roger McNamee, Geschäftsführer und Mitgründer der Venture-Capital-Firma Elevation Partners, hat Pivot aus einer Reihe von beeindruckenden Demos „klar hervorgestochen“.

„Die clevere Benutzeroberfläche ermöglicht eine neue Form des vernetzten Suchens, die meinen Umgang mit dem Web verändern wird“, ist sich McNamee sicher. „Und damit könnte nach Jahren der Langeweile der Suchmaschinen-Krieg wieder spannend werden.“

Pivot packe das ungelöste Datamining-Problem mit einer Oberfläche an, die verschiedene Formate wie Text und Bild kombiniert, lobt auch Martin Wattenberg. Er hat gemeinsam mit Fernanda Viegas für IBM die Visualisierungsanwendung Many Eyes entwickelt. Letztlich gehe es darum, ausgefeiltere mathematische Verfahren zu entwickeln, mit denen sich Daten sortieren lassen. „Nach der Standardabweichung für einen Haufen von Bildern zu fragen, ist schließlich sinnlos“, sagt Wattenberg.

Die große Herausforderung bestehe aber darin, solche Tools in die gängige Webtechnik zu integrieren. Dafür wären offene Standards wünschenswert, damit verschiedene Lösungen mit anderer Software zusammenarbeiten können, sagt Wattenberg. Nutzer könnten dann eine Visualisierung in ihre Webseite einbetten. „Visualisierungstechnologien müssen nahtlos funktionieren. Wie auch sonst in der IT gilt: Es muss jederzeit und überall verfügbar sein.“ (nbo)