Enterprise-Suche: Apache Solr und Lucene in Version 5.0 veröffentlicht

Der quelloffene Suchserver und die ihm zugrunde liegende Bibliothek sollen in der neuen Version durch ergänzende APIs nutzerfreundlicher und darüber hinaus sicherer sein sowie weniger auf den Heap zugreifen.

In Pocket speichern vorlesen Druckansicht 3 Kommentare lesen
Apache Solr und Lucene in Version 5.0 veröffentlicht
Lesezeit: 2 Min.
Von
  • Julia Schmidt

Die Apache-Projekte Lucene und Solr stehen nun in Version 5.0 bereit. Die Suchbibliothek und der mit ihr arbeitende Server sollen mit dem Major Release deutlich an Stabilität gewonnen haben. Außerdem konnten die Entwickler wohl neben Bugfixes auch einige neue Features unterbringen, die den Versionssprung rechtfertigen. Letztlich sind die Änderungen eher evolutionärer als revolutionärer Natur wie noch bei Lucene 4.0 und Solr 4.0.

Lucene soll in der neuen Auflage besonders durch Indexsicherheit punkten können, da beispielsweise für Datenzugriffe nun Javas NIO .2 API zum Einsatz kommt. Segments werden nun jeweils mit eindeutigen Indizes pro Segment und Commit ausgestattet, und während Zusammenführungsprozessen prüft ein sogenannter IndexWriter ankommende Segmente vor dem Merge auf Korruption. Lucene 5.0 soll zudem weniger auf den Heap zugreifen.

Für Solr haben die Entwickler unter anderem an der Nutzerfreundlichkeit gearbeitet, indem sie ergänzende APIs implementiert und die in Version 4.10 eingeführten Skripte zum Starten, Stoppen und Neustarten von Solr-Instanzen ausgebaut haben. Da sie darüber hinaus geändert haben, wie der Zustand eines Clusters gespeichert wird, soll Solr beim Einsatz vieler Collections besser skalieren können. Eine weitere Neuerung, an der wohl besonders viele Freiwillige gearbeitet haben, ist die sogenannte Distributed IDF (verteilte inverse Dokumentenfrequenz). IDF ist einer der Faktoren in Lucenes Scoring-Algorithmus, mit dem sich bestimmen lässt, wie oft ein Ausdruck in einem Index auftaucht. Das neue Feature soll speziell für verteilte Suchen auf uneinheitlichen Shards nützlich sein.

Für die Zukunft ist in Solr unter anderem geplant, eine REBALANCESHARDS Collections API einzuführen und räumliches 2D-Heatmap-Faceting in RPT-Feldern (Recursive Prefix Tree) zu aktivieren. Weitere Informationen zum aktuellen Release lassen sich in den Ankündigungen auf den Seiten von Solr und Lucene nachlesen. (jul)