IBM baut neues Werkzeug zur Datenvisualisierung
Mit BigSheets sollen große Informationsmengen über eine Tabellenoberfläche verfügbar werden.
Enorme Datenmengen stehen frei im Web zur Verfügung und könnten zur Schatztruhe für Forscher und Firmen werden – wenn sich ein Weg fände, sie effizient zu nutzen. IBM hofft nun, dass ein neues Software-Werkzeug namens BigSheets seinen Kunden bald dabei helfen wird, Internet-Daten einfacher zu analysieren. Eine erste Testversion wurde gerade für das Web-Archiv der British Library entwickelt, berichtet Technology Review in seiner Online-Ausgabe. "Wir stehen an der Schwelle zu einem Zeitalter, in dem jeder Nutzer seine eigenen Analysen hochinteressanter Daten vornehmen können wird", erläutert Rod Smith, Vizepräsident für den Bereich Emerging Internet Technologies bei dem IT-Riesen.
BigSheets nutzt die Software-Plattform Hadoop als Basis. Dieses Open-Source-Projekt wurde entwickelt, um große Informationsmengen zu bearbeiten und einzelne Aufgaben effizient auf Cluster verschiedener Rechner zu verteilen. Hadoop wird im Netz häufig eingesetzt, um große Mengen unstrukturierter Daten zu analysieren und wurde von Googles MapReduce-Technik inspiriert.
BigSheets nutzt die freie Software derzeit, um Web-Seiten zu crawlen und sie anschließend zur Ermittelung von Schlüsselbegriffen und anderer sinnvoller Daten durchzugehen. Das Werkzeug organisiert diese Informationen dann in einer sehr großen Tabelle, die die Nutzer mit all jenen Funktionen und Makros bearbeiten können, die sie von Desktop-Tabellenkalkulationen kennen. Im Gegensatz zu regulären Programmen dieser Art gibt es bei BigSheets jedoch keine Größenlimits. Smith zufolge nutzte IBM vor allem deshalb das Modell der Tabellenkalkulation zur Organisation der Daten, weil die meisten Nutzer den Umgang mit solchen Programmen gewöhnt sind. Komplexere Visualisierungen sind aber ebenfalls möglich
Mehr zum Thema in Technology Review online:
(bsc)