Google stellt Training-Werkzeuge für TensorFlow unter Open-Source-Lizenz

Tensor2Tensor soll das Erstellen von Deep-Learning-Modellen mit Googles Bibliothek TensorFlow vereinfachen.

23.06.2017, 10:37 Uhr

Lesezeit: 2 Min.

Von

Alexander Neumann

Google hat das Deep-Learning-Projekt Tensor2Tensor (T2T) unter eine Open-Source-Lizenz gestellt. Bei T2T handelt es sich um eine Python-basierte Bibliothek zur Workflow-Organisation für Trainingsaufgaben, die mit Googles Deep-Learning-Framework TensorFlow durchgeführt werden.

Das Projekt ermöglicht es Entwicklern, die zentralen Elemente von TensorFlow-Modellen zu definieren und die Beziehungen zwischen ihnen festzulegen. Dabei handelt es sich unter anderem um die Möglichkeit, mehrere Datensätze in den Trainings zugleich zu verwenden. Anwender können zudem neue zu ihren Workflows hinzufügen oder sie dem Kernprojekt über eine Pull-Anfrage hinzufügen.

Dann ist es möglich zu beschreiben, um welche Art von Aufgabe es sich handelt, die trainiert werden soll, – etwa Spracherkennung oder Übersetzung und welche Art von Daten daraus zu erwarten und zu generieren sind. Beispielsweise könnte ein Bilderkennungssystem Bilder analysieren und diesen Textbeschriftungen hinzufügen.

Es sind in T2T etliche vertraute Modelle zu finden, es lassen sich darüber hinaus weitere ergänzen. Zudem ist es möglich, Einstellungen vorzugeben, die den Trainingsprozess steuern, sodass Anwender zwischen ihnen umschalten oder sie nach Bedarf zusammenführen können. Parameter, die an die eigentliche Trainings-Binärdatei übergeben werden, lassen sich zusätzlich separat angeben.

Zusammenspiel mit TensorFlow

Da sich mehrere gängige Modelle und Datensätze mit T2T angehen lassen, kann man einfach mit der Wiederverwendung oder Erweiterung eines vorhandenen Modus beginnen und eine der Vorgaben beziehungsweise Modifikationen davon nach Bedarf einsetzen. Das Projekt ist jedoch nicht dafür geeignet, ein Deep-Learning-Projekt zu organisieren. Theoretisch ließe es sich als Teil eines Daten-zu-Vorhersage-Systems für das Erstellen von Machine-Learning-Anwendungen nutzen, aber das ist nicht die eigentliche Aufgabe – den Aufwand beim Erstellen von Trainingsmodellen mit TensorFlow zu reduzieren.

Das von Google vorangetriebene TensorFlow konnte seit der Open-Source-Legung viel Aufmerksamkeit auf sich ziehen, erkennbar auch an der Anzahl der auf GitHub gehosteten Repositories, die darauf Bezug nehmen. Mittlerweile ist TensorFlow zudem in Google-eigenen Angeboten wie dem Translate-Dienst im Einsatz und auch das Künstliche-Intelligenz-Projekt DeepMind greift auf die Bibliothek zurück. (ane)