Apache Lucene und Solr in Version 4.4 verfügbar

Die neuen Versionen der Text Search Engine Library und der darauf aufsetzenden Suchplattform stehen bereit und bringen neben neuen Modi unter anderem verbesserte Analysefunktionen.

In Pocket speichern vorlesen Druckansicht
Lesezeit: 2 Min.
Von
  • Julia Schmidt

Das Project Management Committee des Lucene Projekts hat Version 4.4 der Text Search Engine und der darauf aufsetzenden Suchplattform Solr freigegeben. In den unter dem Dach der Apache Foundation gepflegten Projekten konnten die Entwickler unter anderem einige Optimierungsmaßnahmen vornehmen, Fehler entfernen und neue Funktionen hinzufügen.

Lucene verfügt in der aktuellen Version unter anderem über ein Replicator-Modul, das Indexrevisionen zwischen Server und Client replizieren können soll, sowie über einen AnalyzingInfixSuggester, der Empfehlungen auf Grundlage von übereinstimmenden Token und nicht nur durch das Abgleichen von Präfixen findet. Für das Facet-Modul stehen ergänzende Funktionen wie dynamisches Numeric Range Facteing und Zusammenfassen mehrerer FacetResults der selben Dimension zu einem einzigen bereit. Außerdem verwenden Ints und Longs im FieldCache nun eine Bit-Packing-Technik, um weniger Speicher zu beanspruchen und der Analyzer verfügt über eine zusätzliche tokenStream-Methode. Was den IndexWriter anbelangt, gibt es nun eine Möglichkeit zu signalisieren, ob noch nicht übermittelte Änderungen vorhanden sind.

In Solr 4.4 lassen sich Indizes und Transaktionslogs in HDFS speichern und über die Benutzeroberfläche für Administratoren Dokumente zu Solr hinzufügen. Im neuen Schemaless Mode müssen im Voraus keine Schemamodifiktaionen vorgenommen werden, unbekannte Feldtypen rät Solr anhand der ergänzten oder aktualisierten Dokumente und fügt sie vor dem Update in das Schema ein. Darüber hinaus kann Overseer nun generische Knotennamen vergeben, sodass neue Adressen Shards beherbergen können, ohne dass es zu Durcheinander aufgrund der Namensgebung kommt. Ein systemweiter Info Admin Handler steht nun ebenfalls zur Verfügung, sodass man Systeminformationen nicht mehr mit SolrCore abfragen muss.

Detailiertere Informationen lassen sich den Ankündigungen und den Changelogs, die den neuen Versionen beiliegen, entnehmen. Lucene und Solr stehen unter der Apache-Lizenz v2, interessierte Entwickler können den Quellcode auf den entsprechenden Downloadseiten finden. (jul)