Machine Learning: ONNX 1.8 erhöht Serialisierung beim Erfassen von Sequenztypen

Das Austauschformat für Machine-Learning-Modelle ONNX soll künftig bei der Ein- und Ausgabe von Sequenz- und Kartendatentypen mehr Serialisierung bieten.

In Pocket speichern vorlesen Druckansicht
Lesezeit: 2 Min.
Von
  • Silke Hahn

Das Ökosystem und Austauschformat Open Neural Network Exchange (ONNX) ist in Version 1.8 erschienen. Das Release hat die Serialisierung von Ein- und Ausgaben der Sequenz- und Kartendatentypen überarbeitet, um Operator Unit Test zu ermöglichen.

Mit der seriellen Prüfung der Größe von Elementen in make_tensor sollen Nutzer sicherstellen können, dass Größenverhältnisse und Elemente in einem Tensor konsistent sind. Ein Highlight für Windows-Nutzer dürfte sein, dass die aktuelle Version von ONNX ein neues conda-Paket enthält.

Weitere Änderungen betreffen die Ausgabe-Loops und die Shape-Inferenz, die einige Korrekturen auf der Knoten- und Graphenebene erhalten hat. Neuerdings soll sich das Modul auch bei Modellen über 2 GByte einsetzen lassen. Zum Nutzen dieser Änderung können Anwender die ONNX-API modifizieren. Das ONNX-Team hat die Module für das Training und für die Shape Inference überarbeitet. Für die Definition des Gradientenoperators hat das Trainingsmodul differenzierbare Tags erhalten und ein Werkzeug, das Entwickler bei der Speicherung von Trainingsinformationen mittels Protobuf-Nachrichten unterstützt. Der GraphCall entfällt, stattdessen hat das ONNX-Team IR und Grafik des Trainingsmoduls aktualisiert.

Ursprünglich hatten Facebook und Microsoft ONNX 2017 angestoßen, damit ML-Praktiker zwischen maschinellen Lernframeworks wechseln können. Ziel ist ein neuer Standard, der es Entwicklern erlaubt, ihre Modelle außerhalb des Kontexts zu verwenden, in dem sie diese erstellt haben. Seit 2019 kümmert sich die Linux Foundation um das ONNX-Projekt und entwickelt es weiter, um damit ein herstellerunabhängiges Standardaustauschformat für Machine-Learning-Modelle zu etablieren. Die Vorgängerversion ONNX 1.7 war im Mai 2020 erschienen und markierte den ersten Schritt zum Austausch von ML-Modellen während des Trainings.

Details zu der aktuellen Version lassen sich den Release Notes auf GitHub entnehmen. Weiterführende Hinweise zu dem Projekt und seinen Betreibern finden Interessierte auf der Website von ONNX.

(sih)