Local Heroes
Kostenlose Suchprogramme, die sich sowohl das Web als auch die lokale Festplatte vornehmen, drängen in Scharen auf den Markt.
Die Windows-Suchfunktion ist wahrhaft keine Offenbarung. Der Assistent verlangt unsinnige und verwirrende Entscheidungen, etwa ob man nach „Dokumenten“ oder „Dateien und Ordnern“ suchen will. Entscheidet sich der Nutzer für die Volltextsuche, kann er sich auf eine längere Kaffeepause einstellen, denn der Assistent öffnet umständlich jede Datei, durchsucht sie und schließt sie wieder - das dauert. Eine Suchmaschine, die einen Index anlegt, leistet dasselbe in Bruchteilen von Sekunden. Der Windows-Indexdienst erstellt zwar ein solches Verzeichnis für den Inhalt von Text- und Office-Dokumenten, ist aber tief in der Systemverwaltung versteckt und liest keine PDF-Dateien. Bisher kosteten Desktopsuchmaschinen bis zu 580 Euro; jetzt bieten verschiedene Hersteller kostenlose Lösungen für die Dateisuche an.
Landung auf dem Desktop
Der Google Desktop zieht seit seiner Einführung Mitte Oktober immenses Medieninteresse auf sich. Nach der Installation des knapp 450 KByte großen Pakets lockt er mit der gewohnten HTML-Oberfläche, allerdings nicht im Web, sondern lokal. Die Web-Suche führt das Programm auf Google.com durch. Der zusätzliche Bereich Desktop macht lokale Text- und Office-Dokumente sowie Outlook- und Outlook-Express-Mails zugänglich, des Weiteren Chats des AOL Instant Messenger und den Cache des Internet Explorer inklusive der Inhalte, die über verschlüsselte Verbindungen oder Webmailer dorthin gelangt sind. PDF-Dateien und Postfächer, die nicht von einem Microsoft-Programm stammen, kennt er nicht. Das Ranking basiert nicht auf dem berühmten PageRank-Algorithmus, sondern auf verschiedenen Kriterien wie der Worthäufigkeit und ob das Wort im Titel oder Fließtext steht.
Obwohl der Google Desktop keinerlei Daten an die Konzernmutter übermittelt, sind Bedenken angebracht, wenn es um die Wahrung der Privatsphäre geht, denn das Tool fragt nach der Installation nicht lange nach, was es indexieren soll, sondern legt einfach los. Nach Beginn der Indexierung kann der Nutzer die Einstellungen ändern: So kann er Dateitypen, die Web-History des Internet Explorer, HTTPS-Seiten oder einzelne Domains beziehungsweise Ordner vom Index ausschließen. Ist er jedoch unvorsichtig und ändert die Default-Einstellung nicht, protokolliert Googles Desktop fleißig mit. So kann ein unachtsamer Nutzer in Sekundenschnelle ausspioniert werden, wenn er seinen Rechner unbeaufsichtigt lässt. „Der Google Desktop befindet sich derzeit noch im Beta-Stadium. Es ist möglich, dass wir gewisse Bereiche zukünftig nur noch passwortgeschützt zugänglich machen werden“, sagte dazu Google-PR-Manager Stefan Keuchel gegenüber c't. Immerhin indexiert Google nicht den Browser-Cache anderer Benutzer.
Ein Anbieter, der schon früher am Markt war, geht vorsichtiger zu Werke. Die HotBot-Deskbar, mit der Lycos am 22. März dieses Jahres antrat, die Lücke zwischen Desktop- und Internet-Suche zu schließen, indexiert nur die vom Benutzer angegebenen Dateien. Die Tool-Leiste für den Internet Explorer durchsucht neben der hauseigenen Suchmaschine HotBot auch E-Mails in Outlook oder Outlook Express, lokale Office-, Text- und im Unterschied zum Google Desktop obendrein PDF-Dateien und RSS-Feeds.
Die anderen Großen der Branche ziehen nach: Wie John Connors, Finanzvorstand bei Microsoft, am 22. Oktober verlauten ließ, will MSN bereits Ende 2004 mit einer kostenlosen Suchmaschine für Desktopinhalte nachlegen. Gerüchten zufolge plant auch Yahoo, ein ähnliches Tool anzubieten. Mit blinkx beta ist eine weitere, für Deutschland angepasste Suchmaschine verfügbar (siehe dazu S. 76, c't 23/04).
Allround-Sucher
Der Anbieter des Metasuch-Tools Copernic Agent offeriert seit August das Standalone-Programm Copernic Desktop Search. Outlook- und Datei-Ordner, die durchsucht werden sollen, wählt der Nutzer aus einer Liste aus. Für die Websuche hält das Tool die Seite Alltheweb.com im eingebundenen Internet Explorer bereit. Ein in die Taskleiste integriertes Eingabefeld erlaubt eine schnelle Suche. Über ein Pulldown-Menü wählt man die Bereiche „Files“, „Mail“, „Web“ oder thematische Kategorien aus. PDF-, Text- und Office-Dokumente aus der Ergebnisliste stellt Copernic in einem eigenen Vorschaufenster mit markierten Suchbegriffen dar, was die Auswertung der Resultate deutlich vereinfacht.
Etwa zur gleichen Zeit wie Copernic startete Jetbrains mit der Beta-Version von Omea 1.0, ebenfalls einem Standalone-Programm, das in Outlook-Postfächern, Dateien, RSS-Feeds und den in IE-, Firefox- und Mozilla-Bookmarks vermerkten Seiten stöbert, also lediglich auf Seiten, die der Nutzer schon kennt. Omea markiert wie Copernic Suchbegriffe an den Fundstellen, berücksichtigt aber keine PowerPoint- und Excel-Dateien. Außerdem lässt das Programm sowohl beim Start als auch bei der Vorschau gefundener Dateien auf sich warten.
Die Münsteraner Firma x-dot gab im Oktober Version 0.2 ihres x-friend zum Download frei. Das Programm ist komplett in Java geschrieben und läuft daher auf Windows, Mac OS und Linux gleichermaßen. Es durchsucht neben dem Web und lokalen Dateien RSS-Feeds und IMAP-Mailkonten. Wie beim Google Desktop wird ein Web-Browser als grafisches Frontend vorausgesetzt. Die Oberfläche von x-friend teilt sich auf in die Kategorien Internet, Shopping, PC, News und Mails. Im Bereich PC durchsucht x-friend zuverlässig lokale Dateien der Typen HTML, DOC, TXT, XLS und PDF, außerdem EXIF-Informationen in JPEG- sowie Metatags in MP3-Dateien. Die Websuche macht sich den Content der Yahoo-Tochter Overture zunutze.
Am 14. Oktober gab der US-amerikanische Software-Hersteller Filehand bekannt, sein gleichnamiges Suchtool nun kostenlos zu vertreiben. Am 25. Oktober zog die pfälzische A-Z Technology mit ihrem A-Z Finder nach, der den Privat-Anwender bisher 40 Euro kostete. A-Z Finder durchsucht neben gängigen Office-Formaten, RTF-, PDF-Dateien und Outlook- wie Outlook-Express-Ordnern als einziges Programm auf weiter Flur auch Formate von OpenOffice und StarOffice. Demnächst sollen Suchoptionen für die Registry und Mailverzeichnisse im mbox- und maildir-Format folgen.
Tief ins System
Bald könnten jedoch auch die vorgestellten Tools wieder obsolet werden, denn die Entwickler aller Betriebssysteme arbeiten an so genannten Database File Systems. Solche Datenbankaufsätze für das Dateisystem speichern Metadaten wie den Textinhalt einer Office- oder den Meta-Tag einer MP3-Datei. Beliefern erst alle Applikationen diese Datenbank, hat die systemeigene Suche einen immensen Vorsprung gegenüber einem externen Suchtool, denn dessen Programmierer müssen für jedes Dateiformat selbst herausfinden, wie die Information dort gespeichert ist.
Die KDE-Entwickler arbeiten bereits an einem DBFS, wie auf der KDE-Entwickler-Konferenz „aKademy“ im August in Ludwigsburg bekannt wurde. Es soll ab KDE 4 verfügbar sein und einen Index erstellen, auf den ein File Manager (KDBFS) zugreift. Mac OS 10.4 alias „Tiger“, das Apple voraussichtlich Mitte 2005 einführen wird, soll Informationen zu Dateien in einem systemweiten „Metadata Store“ ablegen, der einen blitzschnellen Zugriff ermöglicht. Die Suchfunktion namens „Spotlight“ soll auch Zugriff auf den Datei-Inhalt erhalten.
Microsoft plant ebenfalls die EinfĂĽhrung eines Database File Systems namens WinFS, das auf Microsofts SQL-Server basiert. Es ordnet jede Datei in Kategorien wie Musik oder Photos ein und speichert Meta-Informationen wie EXIF-Header oder den Text eines Word-Dokuments. AuĂźer Dateien kann es zudem Kontakte, Notizen und E-Mails aufnehmen. UrsprĂĽnglich sollte WinFS gemeinsam mit der neuen Windows-Version mit dem Codenamen Longhorn ausgeliefert werden. Wie Microsoft bekannt gab, wird WinFS jedoch nicht rechtzeitig fertig werden. (akr)
(akr)