Datenintegration: Apache Hop 2.3 lädt Daten für die Analyse schneller

Das Update der Hop Orchestration Platform integriert den Vertica Bulk Loader und aktualisiert die Dokumentation.

In Pocket speichern vorlesen Druckansicht 1 Kommentar lesen
Datenintegration: Apache Hop 2.3 lädt Daten für die Analyse schneller

(Bild: Itzchaz/Shutterstock.com)

Lesezeit: 2 Min.
Von
  • Matthias Parbel

Die Java-basierte Datenintegrationsplattform Apache Hop Orchestration Platform (Hop) integriert in Version 2.3 den Vertica Bulk Loader, mit dem sich Daten zur Analyse schneller in die Vertica-Datenbank laden lassen. Das neue Hop-Release aktualisiert darüber hinaus verschiedene Bereiche der Dokumentation und vertraut auf Weblate für das Übersetzen der Plattform in bisher noch nicht verfügbare Sprachen.

Apache Hop 2.3 ist die erste Version des ASF-Top-Level-Projekts nach dem Wechsel von JIRA auf GitHub Issues. Zu den wichtigen Neuerungen im Release zählt die Integration des Vertica Bulk Loader, der bisher lediglich als externes Plug-in zur Verfügung stand. Ab sofort ist der Loader aber vollständig in den Sourcecode von Hop eingebunden. Laut Ankündigung des Entwicklungsteams soll sich dadurch das Laden von Daten in die Analysedatenbank Vertica "drastisch" beschleunigen. Der Bulk Loader verwendet VerticaCopyStream, um die Daten direkt in die Vertica-Datenbank zu streamen, statt "Umwege" wie etwa eine Table-Output-Transformation nutzen zu müssen.

Das Hop-Team hat sich im neuen Release auch dem Thema Dokumentation gewidmet. Neue Informationen festzuhalten oder die bestehende Dokumentation zu aktualisieren, gehört zu den wichtigsten Aufgaben – ist aber auch lästig. In Hop 2.3 finden sich daher einige Neuerungen, die Erleichterung versprechen: Befehle sind jetzt unmittelbar auf separaten Registerkarten für Windows und Linux/macOS sichtbar. Besonders großen Tabellen oder Codeblöcke lassen sich nun der Übersichtlichkeit halber über einen Kippschalter auf- oder zuklappen. Darüber hinaus wurden die Seiten zu Metadata Injection ergänzt und aktualisiert, ebenso wie die zum Metadatentyp Pipeline Probe. Neu hinzugekommen in der Dokumentation ist eine Liste von Blogbeiträgen und Artikeln aus der Community.

Eine Zusammenfassung der wichtigsten Neuerungen in Apache Hop 2.3 liefert der Blogbeitrag. Die komplette Übersicht aller Änderungen findet sich in den Release Notes auf GitHub.

(map)