Apache UIMA Java SDK 3.0.0 für Java 8 und HPC-Multicore-Prozessoren angepasst

Das Framework zur Analyse unstrukturierter Daten wurde in Version 3 komplett überarbeitet. Das UIMA Java SDK setzt nun Java 8 voraus. Es ist weitgehend kompatibel zu den 2.x-Vorgängerversionen, user-defined JCas-Klassen erfordern jedoch eine Migration.

In Pocket speichern vorlesen Druckansicht
.NET: Project Snowflake kombiniert manuelle Speicherverwaltung und Garbage Collection
Lesezeit: 1 Min.
Von
  • Matthias Parbel

Das Team von Apache UIMA hat Version 3.0.0 des UIMA Java SDK vorgelegt – mit komplett neu geschriebenen Core-Elementen von UIMA. Das Framework, das insbesondere bei der Analyse von unstrukturierten Daten wie Ton, Video und Text zur Anwendung kommt, wurde für Java 8 und den Einsatz auf Multicore-Prozessoren optimiert. So wurden die internen Algorithmen und die Speichernutzung für aktuelle Hardware angepasst. Die übrigen Neuerungen betreffen vor allem die Integration mit Java 8 Streams, aber auch in Java 8 Idiome und Generic Typing. Das SDK unterstützt zudem beliebige Java Objects, die Nutzer in den JCas-Implementierungen nutzen können, um zusätzliche UIMA-Typen zu definieren. Eine detaillierte Beschreibung dazu findet sich im User Guide des SDK.

Trotz der zum Teil grundlegenden Neuerungen soll UIMA Java SDK 3.0.0 weitgehend abwärtskompatibel zu den Pipelines der 2.x-Versionen bleiben. Eine Ausnahme stellen jedoch die von Nutzern definierten JCas-Klassen dar. Diese müssen für Version 3 neu erstellt oder migriert werden. Ein geeignetes Migrationswerkzeug stellt das Apache-UIMA-Team zur Verfügung. Anwender, die nicht migrieren wollen, sollen hingegen Version 2.10.2 des SDK nutzen, die auch weiterhin gepflegt wird. Das SDK steht auf der Projektwebsite von Apache UIMA zum Download bereit. Eine Übersicht aller Neuerungen bieten die Release Notes zu UIMA Java SDK 3.0.0. (map)