Die "Über-Suchmaschine": ElasticSearch 1.0 ist fertig
ElasticSearch erweitert die quelloffene Volltext-Suchbibliothek Lucene um eine REST-Schnittstelle und gute Skalierbarkeit. Die neue Version 1.0 bringt wichtige Neuerungen für den Produktiveinsatz.
Eine Volltextsuche à la Google ist heutzutage eine selbstverständliche Grundfunktion von Websites. Mit Lucene stellt die Apache Software Foundation eine quelloffene Java-Bibliothek bereit, die alle nötigen Funktionen zur Suche bietet.
ElasticSearch, gerade in Version 1.0 erschienen, erweitert Lucene um eine JSON-basierte REST-API, die sich nicht nur für die Volltextsuche, sondern auch für die Analyse strukturierter Daten wie Logdaten eignet. Die zu durchsuchenden Daten werden dabei dokumentenzentriert abgespeichert. Außerdem ist ElasticSearch von Anfang an als skalierbare Lösung konzipiert: Wenn ein Rechner für die Suche nicht mehr ausreicht, lässt sich der Datenbestand problemlos auf mehrere Maschinen verteilen – Ausfallsicherheit inklusive. Obwohl die Such-Software erst in Version 1.0 vorliegt, wird ElasticSearch bereits auf großen Websites produktiv eingesetzt, darunter Xing, Github, Netflix, Foursquare und Soundcloud.
Neu in ElasticSearch 1.0 ist die Möglichkeit, einen Snapshot des aktuellen Datenbestands nach Amazon S3 oder in ein Hadoop Distributed Filesystem (HDFS) zu kopieren. An Snapshots auf Windows Azure wird gearbeitet. Aggregationen bieten mächtige Möglichkeiten, Suchergebnisse zu kategorisieren und darüber die Suche zu verfeinern. Die neue cat API liefert Informationen über einen ElasticSearch-Cluster im Klartext statt als JSON-Dokumente, was das Debugging und schnelle Statusabfragen erleichtert. Verteilte Percolations speichern Suchanfragen und untersuchen neue Dokumente darauf, ob sie eine Suchanfrage matchen.
ElasticSearch läuft unter Linux, Unix und Windows und steht unter Apache-Lizenz 2.0 zum Download bereit.
Siehe dazu auf heise Developer:
(odi)