Jenseits von Google

Jahrelang gab es nur ein Synonym für Internet-Suchmaschinen: Google. Doch im Umfeld des scheinbar allmächtigen Marktführers entstehen jetzt interessante Alternativen und Kooperationen.

In Pocket speichern vorlesen Druckansicht
Lesezeit: 9 Min.
Von
  • Steffan Heuer

Dieser Text ist eine gekürzte Fassung eines Beitrags, der in der Print-Ausgabe 08/2009 von Technologie Review erschien. Das Heft kann, genauso wie ältere Ausgaben, hier online portokostenfrei bestellt werden.

Jahrelang gab es nur ein Synonym für Internet-Suchmaschinen: Google. Doch im Umfeld des scheinbar allmächtigen Marktführers entstehen jetzt interessante Alternativen und Kooperationen.

Anderthalb Milliarden Dollar sind ein Haufen Geld. Der Netto-Gewinn, den der Suchmaschinen-Betreiber Google trotz anhaltender Wirtschaftsflaute im ersten Quartal dieses Jahres eingestrichen hat, inspiriert die Mitbewerber nun zu neuen Höhenflügen: Erst stellt Software-Guru Stephen Wolfram seine "Wissensmaschine" Wolfram Alpha online, dann schickt Microsoft seinen generalüberholten "Live Search"-Dienst unter dem Namen Bing ins Rennen – ausgestattet mit modernster semantischer Technologie des Unternehmens Powerset, das der Software-Riese im vergangenen Jahr für rund 100 Millionen Dollar geschluckt hatte.

Gleichzeitig entstehen abseits der etablierten Marken eine ganze Reihe von spannenden Suchdiensten – von Aardvark über Hunch bis zu OneRiot und Siri –, die dem Branchenprimus durch neue technische Ansätze Marktanteile abjagen wollen. Sie setzen neue Maßstäbe an drei Fronten: natürliche Spracherkennung, für Mobilgeräte optimierte Benutzerschnittstellen sowie die intelligente Kombination von Suchalgorithmen mit jener "Weisheit der vielen" – von Nutzern gefütterte, Crowdsourcing genannte Empfehlungssysteme.

Microsofts Suchexperten muss klar gewesen sein, dass sie eine schwierige Aufholjagd vor sich haben – selbst mit der Verstärkung durch die Powerset-Experten. Das Start-up aus San Francisco war eine der heiß gehandelten Neugründungen auf dem Gebiet der semantischen Suche, die dem Web endlich echtes Sprachverständnis und einen Hauch künstliche Intelligenz beibringen wollten. Es hatte seine Technologie allerdings nie der breiten Öffentlichkeit vorgestellt. Zum Start von Bing hängte Microsoft den Einfluss von Powersets Technologie nun allerdings erstaunlich niedrig. So funktioniert die semantische Analyse nach wie vor nur bei den rund zwei Millionen Einträgen der Wikipedia, an denen Powerset seit mehreren Jahren übte, aber nicht bei den Milliarden von Webseiten und Dokumenten, die Live Search selbst indiziert hat.

Die auf Anfragen in den populären Bereichen Nachrichten, Reise und Shopping ausgelegte Suchmaschine ist laut Microsoft-Chef Steve Ballmer denn auch "kein Quantensprung der Innovation", aber Innovation sei "auch keine Garantie für zufriedene Kunden". Microsoft hat sich vielmehr darauf konzentriert, Marktanteile bei einer Hand voll beliebter Themen zu gewinnen und so mehr Anzeigeneinnahmen zu generieren. Immerhin konnte der Software-Konzern seinen Marktanteil in den USA in den drei Wochen seit dem offiziellen Start von Bing um drei Prozent steigern. Yahoo, mit einem Marktanteil von etwa 20 Prozent der zweitgrößte Suchmaschinen-Betreiber, stand im vergangenen Jahr monatelang in Verhandlungen mit Microsoft über eine Fusion. Inzwischen haben sich die Unternehmen auf einen zehn Jahre laufenden Pakt geeinigt, bei dem Bing die Web-Suche für Yahoo stellt. Eine Kombination von Yahoo und Microsoft kommt immerhin auf die Hälfte des Marktanteils von Google.

Die Zukunft der Suchmärkte könnte aber auch im Mobilbereich liegen. So greifen in Schwellenländern wie Indonesien und den Philippinen drei- bis viermal mehr Nutzer vom Handy auf Yahoo zu als vom Rechner auf dem Schreibtisch. Sie erwarten simple, aber nützliche Resultate, bei denen Zeit und Standort wichtig sind. Der Suchbegriff "Star Trek" etwa gilt von einem Handy aus wahrscheinlich nicht dem Wikipedia-Eintrag, sondern der nächsten Vorstellung des neuen Kinofilms in der Nähe des jeweiligen Standorts. "Mobilgeräte sind das künftige Schlachtfeld bei der Suche", ist sich Raghavan sicher. Um Webseiten noch besser auswerten zu können, hat Yahoo zudem im vergangenen Mai einen "SearchMonkey" genannten Service eingeführt: Der Dienst erlaubt es den Betreibern von Webseiten, selbst zu definieren, wie die auf ihren Seiten enthaltenen Informationen zu verstehen sind und diese vorstrukturierten Informationen an Yahoo zu liefern. Aus diesen sogenannten Mikroformaten kann die Suchmaschine dann Details wie Wegbeschreibungen, Telefonnummer oder Rezensionen schneller herausfiltern und besser aufbereiten als etwa über Schlüsselbegriffe.

Auf den ersten Blick erhöht das die Gefahr der Manipulation – so als ob man einem Archivar blind vertrauen würde, dass er nur neue Bücher und keine Werbekataloge in die richtigen Regale einordnet. Nur wenn man mit "validierten Informationsquellen" arbeite, sagt Raghavan, vermeide man das Risiko, Werbemüll untergeschoben zu bekommen. Mit einer "Prise Crowdsourcing" ließen sich so auf absehbare Zeit bessere Ergebnisse erzielen, so der Computerwissenschaftler, "als mit Millionen-Investitionen in künstliche Intelligenz und natürliche Spracherkennung." SearchMonkey liefert gegenwärtig pro Tag rund 70 Millionen Ergebnisse in 23 Ländern. Die verbesserte Datenaufbereitung hat dazu geführt, dass die Quote der angeklickten Ergebnisse im Vergleich zu herkömmlichen Resultaten um 15 Prozent gestiegen ist.

Die Macher des Software-Assistenten Siri setzen auf einen anderen Ansatz. Aus einem ursprünglich militärischen Forschungsprojekt entstand eine Software, die umgangssprachlich formulierte Fragen vom Handy annimmt – geschrieben oder gesprochen. Sie ordnet etwa die Frage "Was kann ich heute Abend unternehmen?" in den Kontext von Zeit und Ort ein, fragt mehrere Dutzend Webdienste an und bündelt deren Antworten in einem knappen Satz wie eine geübte Sekretärin. Die kommerzielle Variante soll noch im Sommer als iPhone-Anwendung auf den Markt kommen – die Idee ist Wagniskapitalisten bisher rund 8,5 Millionen Dollar wert gewesen. Zu Anfang bearbeitet Siri die üblichen Kategorien, die Provisionseinnahmen versprechen: Reise, Unterhaltung und Gastronomie. Im nächsten Schritt plant die Firma, Anfragen in zusätzlichen Sprachen neben Englisch zu beantworten und die Maschine mit dem Kalender und Adressbuch eines Nutzers zu verbinden. Diese voraussichtlich kostenpflichtigen Extras würden das Stöbern im eigenen Datenfundus als unstrukturierten Dialog erlauben ("Wann ist meine Besprechung mit XYZ?", "Wen treffe ich morgen?"). Siri kann außerdem mit zusätzlichem Fachvokabular und weiteren Diensten nachgerüstet werden.

Derweil formiert sich auch der Bookmarking-Dienst Twine, von Semantik-Vordenker Nova Spivack gegründet und mit bislang 26 Millionen Dollar Wagniskapital finanziert, zu einer neuen Art von Suchmaschine um: "Es geht in Zukunft nicht mehr ums Suchen, sondern ums Filtern", sagt Spivack. Aus einem nach Schlagwörtern organisierten Verzeichnis von mehreren Millionen Webseiten, die Nutzer in ihren Ordnern angelegt haben, soll noch in diesem Sommer ein neuartiger Dienst geschmiedet werden. Über die Suchtechnik will Spivack nur so viel verraten: Das System soll aus den bekannten Präferenzen des Nutzers, die sich in seinen Bookmarks, Ordnern und Tags niederschlagen, lernen. Aus der Tatsache, dass jemand nach dem Thema Reise und einem Termin im Oktober 2010 sucht, könnte Twine dann relevante Neuigkeiten rund um diese Urlaubspläne ableiten, die es an den Nutzer weitergibt. Wie gut die semantischen Algorithmen in der Praxis arbeiten, wird man abwarten müssen – anders als bei der konkreten Antwort auf konkrete Fragen lässt das System eine gewisse Unschärfe zu.

Aardvark und Hunch dagegen wollen die noch immer existierende Schwäche des Computers durch die automatisch vermittelte Hilfe freiwilliger menschlicher Zuarbeit ausgleichen: Aardvark (Erdferkel) wurde von einer Hand voll ehemaliger Google-Mitarbeiter in San Francisco gegründet und hat sich darauf spezialisiert, Suchanfragen live per Instant Messenger oder E-Mail zu beantworten – als eine Art automatisiertes Crowdsourcing-Projekt. Die Software extrahiert Themen und Stichwörter aus den eingeschickten Fragen und leitet sie wie eine elektronische Weiche denjenigen Nutzern zu, die sich laut eigenem Bekenntnis oder dank Empfehlungen von Freunden damit auskennen. So lassen sich auch vage und verknüpfte Fragen klären, auf die Google kaum eine Antwort weiß: "Wo kann ich in London als Frau allein französisch essen gehen, wenn ich weniger als 60 Pfund ausgeben will?"

Ähnliche Crowdsourcing-Ambitionen hat die New Yorker Firma Hunch (Ahnung), die von der Flickr-Mitbegründerin Caterina Fake gestartet wurde und deren Webseite seit Mitte Juni öffentlich zugänglich ist. Hier führen Algorithmen durch Frage-und-Antwort-Spiele mit Multiple-Choice-Auswahl. Die Frage "Welche Digitalkamera ist am besten?" beantwortet Hunch also zunächst mit der Gegenfrage "In welcher Preisklasse?", bis das Wechselspiel von Frage und Antwort schließlich zu einer Entscheidung führt. In der Testphase haben 50000 Nutzer bereits sieben Millionen Fragen beantwortet und so gratis einen Grundindex zu 2000 Themen angelegt. Jeder weitere Nutzer kann nun seine eigenen Entscheidungspfade basteln und der Allgemeinheit empfehlen. Der Wettbewerb bleibt also spannend.

Doch wer glaubt, dass diese Frage ausschließlich über die Qualität der Suchergebnisse geklärt wird, der irrt: Nur 45 Prozent aller User entscheiden sich einer Umfrage des "Wall Street Journal" zufolge aufgrund der Qualität der Ergebnisse für einen bestimmten Suchdienst. Mehr als ein Drittel aller Surfer bleiben ihrer Suchmaschine aus Gewohnheit treu, weitere 35 Prozent, weil sie der Marke vertrauen. (bsc)