Auch Baidu gibt Software für maschinelles Lernen im Source frei

Nachdem im vergangenen Jahr Google, IBM und Facebook Teile ihrer Software für maschinelles Lernen zu Open Source machten, zieht die chinesische Suchmaschine nun nach.

In Pocket speichern vorlesen Druckansicht
Auch Baidu gibt Software für maschinelles Lernen im Source frei

(Bild: dpa, Stephan Scheuer)

Lesezeit: 1 Min.
Von
  • Rainald Menge-Sonnentag

Der chinesische Google-Rivale Baidu hat den Kern seiner Software für maschinelles Lernen auf GitHub veröffentlicht. Warp-CTC ist eine C-Bibliothek mit zusätzlichen Torch-Bindings. CTC steht für die 2006 entwickelte Loss Function Connectionist Temporal Classification, die in neuronalen Netzen zum Einsatz kommt. Baidus Bibliothek ist eine parallele Implementierung, die CPU und GPU zur Berechnung nutzt.

Der chinesische Suchriese nutzt die Funktion unter anderem zur Spracherkennung. Chinesisch bringt aufgrund der unterschiedlichen Bedeutung der Tonhöhe zusätzliche Herausforderungen im Vergleich zur Erkennung von Lauten in westlichen Sprachen. Baidu preist Warp-CTC vor allem wegen des geringeren Speicherverbrauchs und der besseren Performanz im Vergleich zu anderen CTC-Implementierungen an.

Mit der Offenlegung der Quellen bittet Baidu die Community auch um Mitarbeit. Damit will der Suchanbieter vermutlich auch sicherstellen, dass er nicht ins Hintertreffen gerät. Vergangenes Jahr hatten viele große IT-Unternehmen ihre Software zu Open Source erkoren: Google gab TensorFlow heraus, IBM veröffentlichte SystemML und Facebook hat bei der Vorstellung des Big-Sur-Servers die komplette Offenlegung der Hard- und Software angekündigt. Während bei Baidu das amerikanische Lab im Mittelpunkt steht, hatte Microsofts Forschungsinstitut in Peking das Distributed MachineLearning Toolkit veröffentlicht.

Auf GitHub finden sich die Quellen der Bibliothek und Torch-Bindings. Warp-CTC steht unter der Apache-2.0-Lizenz. (rme)