Open-Source-Suchmaschine will in die erste Liga
Das Projekt Nutch will eine Alternative zu den bekannten kommerziellen Volltext-Suchmaschinen schaffen.
Das Projekt Nutch will eine Alternative zu den bekannten kommerziellen Suchmaschinen schaffen -- nach dem Vorbild des Open Directory (www.dmoz.org), nur eben als Volltextsucher. Dazu hat man sich viel vorgenommen: Mehrere Milliarden Seiten pro Monat soll die Open-Source-Suchmaschine durchforsten und indizieren; 1000 Anfragen pro Sekunde will man bearbeiten können.
Derzeit arbeitet eine Handvoll Programmierer in Teilzeit an dem Projekt; weitere Entwickler sind willkommen. Der derzeitige Code ist komplett in Java gehalten. Seit Juni besteht ein Demo-System aus 100 Millionen Seiten, das man aber mangels leistungsfähiger Hardware noch nicht publik machen möchte -- Spenden für ein Demosystem werden gerne entgegengenommen.
Ziel des Projektes ist aber nicht ein öffentlicher, lauffähiger Service, sondern nur eine kleine Demo-Site -- und vor allem ein Open-Source-Softwarepaket, von dem man hofft, dass kommerzielle Suchmaschinen es statt der bisherigen Software einsetzen. An der Qualität der Suchergebnisse, heißt es, muss noch gearbeitet werden. Man erhofft sich durch die Offenlegung der Ranking-Algorithmen ähnliche Effekte wie von veröffentlichten Algorithmen von Verschlüsselungs- und Antivirensoftware, da interessierte Entwickler schneller Fehler finden und Verbesserungen einbauen können. (jo)