Start-ups im Echtzeit-Netz
Microblogging a la Twitter und Status-Updates in sozialen Netzwerken sind nur der Anfang: Mehrere Neugründungen versuchen, das ständig schneller werdende Web mit Realtime-Daten zu versorgen.
- Erica Naone
Microblogging a la Twitter und Status-Updates in sozialen Netzwerken sind nur der Anfang: Mehrere Neugründungen versuchen, das ständig schneller werdende Web mit Realtime-Daten zu versorgen.
Das "Realtime-Web" ist dieser Tage ein heißes Konzept: Sowohl Google als auch Microsoft überbieten sich darin, ihren Suchmaschinen Zugriff auf Echtzeit-Informationen zu verschaffen, die dann in den Ergebnislisten ganz oben stehen. Parallel dazu versuchen gleich mehrere Start-ups, Techniken zu entwickeln, mit denen die frischesten Informationen im Web gesammelt und vor allem auch praktisch genutzt werden können.
Diese glauben, dass zum Echtzeit-Web mehr gehört als nur ein Abbild von Twitter-Postings, Status-Updates aus sozialen Netzwerken oder Links auf die neuesten journalistischen Nachrichten aus aller Welt. Enorm viele Daten werden vor allem hinter den Kulissen generiert – allein schon aus dem Nutzerverhalten heraus, egal ob ein User nun ein Video ansieht, eine Anzeige anklickt oder irgendetwas anderes in seinem Browser tut. Wenn diese Daten in Höchstgeschwindigkeit verarbeitet werden können, glauben die neuen Realtime-Firmen, ließen sich beispielsweise Möglichkeiten finden, Inhalte auf Websites noch besser anzupassen.
Viele Internet-Firmen nutzen bereits Analysesysteme, um ihr Angebot den Tag über anzupassen und zu optimieren. Einige Online-Nachrichtenangebote verändern beispielsweise das Layout ihrer Homepage, indem sie die Popularität der verschiedenen Artikel überwachen. Traditionell werden solche Informationen jedoch zunächst nur gesammelt und abgespeichert und dann erst später analysiert. Die Verwendung von nur Sekunden alten Daten zur Anpassung von Inhalten gilt daher als nächster Schritt. Besonders interessant wäre das beispielsweise im Bereich der Online-Werbung. Hier versuchen derzeit auch erste Start-ups, entsprechende Lösungen zu offerieren.
Sailesh Krishnamurthy, Mitbegründer der Datenanalyse-Firma Truviso aus dem kalifornischen Foster City, gehört zu den Pionieren auf dem Gebiet. Er meint, es würden bereits jetzt Hunderte Milliarden Datenpunkte allein im Bereich des boomenden Online-Video-Segments geschaffen. "Wenn man diese Hits mit der sie begleitenden Werbung aggregiert, hat man ein komplexes Ökosystem von Firmen vor sich, die diese Anzeigen ausliefern, sie managen und ihren Erfolg zu ergründen suchen." Es sei ziemlich erstaunlich, wie viele Aktivitäten eine einzelne Nutzerinteraktion hinter den Kulissen inzwischen auslöse.
Die Echtzeit-Datenanalyse hat ihre Wurzeln in Software zur Sichtung von Finanzmärkten. Ben Lorica, Senior-Analyst bei O'Reilly Media, glaubt, dass nun auch Web-Firmen ihre Anzeigen, ihre Videos und ihre Multimedia-Kampagnen so schnell wie möglich optimieren wollen. Dienste, die Web-Inhalte sofort anpassen, machen diesen Ansatz auch für Endnutzer relevant. "Wenn den Leuten klar wird, dass sie Inhalte herausbringen können, die dann von anderen in Echtzeit konsumiert werden, wollen sie natürlich selbst wissen, wie dieser Konsum erfolgt."
Truviso und ein weiteres Start-up namens StreamBase aus Lexington in Massachusetts haben Software-Pakete geschaffen, mit denen Web-Analyse-Daten in Echtzeit verarbeitet werden können. Beide Firmen sind Spinoffs aus der universitären Forschung. Dort ging es allerdings um ganz andere Echtzeitdaten - solche aus Sensornetzen beispielsweise, die unter anderem zur Überwachung von Umweltdaten genutzt wurden. Richard Tibbetts, Technikchef von StreamBase, erklärt, dass Finanzmarktfirmen derzeit noch 80 Prozent seiner Kunden ausmachen. Web-Unternehmen fingen erst damit an, die Technologie anzuwenden.
Vorstellbar seien beispielsweise Mashups aus verschiedenen Angeboten, die sich in Echtzeit mit neuesten Informationen füllten. Ein solches Angebot könnte beispielsweise sekundengenaue Fluktuationen bei Flugticketpreisen überwachen, um dann automatisch einen Kauf auszulösen, sollten sie unter einen bestimmten Wert fallen.
Truviso bietet seit kurzem eine Software an, mit der Websites in Echtzeit die aktuelle Zahl eindeutiger Besucher berechnen können - ein traditionell eher schwieriges Problem, weil dazu verschiedene Schritte durchgeführt werden müssen, während entsprechende Anfragen noch laufen.
Sowohl StreamBase als auch Truviso arbeiten derzeit noch mit konventionellen strukturierten Datenbanken, die in Form von Tabellen vorliegen. Das könnte sich bald ändern: Analyst Lorica sieht einen großen Bedarf in der Echtzeit-Analyse unstrukturierter Daten.
Software-Umgebungen wie das Open-Source-Produkt Hadoop oder Googles MapReduce werden gerne zur Untersuchung unstrukturierter Daten eingesetzt - beispielsweise in Suchmaschinen. Doch Realtime ist das selten. Aktuelle Forschungsprojekte bei Yahoo und der University of California, Berkeley, versprechen nun Methoden, die das auch in Echtzeit können.
Joseph Hellerstein, Professor fĂĽr Computerwissenschaften in Berkeley, der an dem Projekt beteiligt war, meint, der wichtigste Teil der Arbeit liege darin, Geschwindigkeitssteigerungen bei Hadoop und MapReduce zu erreichen, ohne dass gleichzeitig Daten verloren gehen. Damit soll dann das ganze Web eines Tages in Echtzeit vorliegen.
Realtime-Anwendungen, egal ob sie nun auf traditionellen Datenbanktechnologien basieren oder auf neueren wie Hadoop, dürften sich in den nächsten Jahren rasant weiterentwickeln. "Wenn die Leute heute vom Echtzeit-Web sprechen, meinen sie einen engen Blick darauf - Endkunden-Anwendungen wie Twitter, Facebook und ein bisschen auch die Suchmaschinen", meint StreamBase-Mann Tibbetts. Das könnte sich schnell ändern.
(bsc)