Maschinelles Lernen: Microsoft teilt Project Oxford auf

Die Funktionen des Cloud-Dienstes wie Bildanalyse und Verständnis natürlicher Sprache sind künftig als separate Module verfügbar. Hinzu kommen weitere Dienste wie die Bing-Search-APIs.

In Pocket speichern vorlesen Druckansicht
Microsoft teilt Project Oxford auf
Lesezeit: 2 Min.

Im Frühjahr 2015 hatte Microsoft Project Oxford als eine Sammlung von Cloud-Diensten veröffentlicht, die maschinelles Lernen für diverse Analysefunktionen verwenden. Entwickler verbinden ihre Software über plattformspezifischen SDKs mit dem Cloud-Angebot, das passende REST APIs zur Verfügung stellt. Im Lauf des Jahres kamen unter anderem ein Dienst zum Verständnis natürlicher Sprache und einer zum Erkennen von Emotionen auf Gesichtern hinzu.

Nun hat Microsoft das Projekt in einzelne Module aufgeteilt, und der Link auf die alte Website führt zu den neuen Diensten, die "Cognitive Services" heißen. Ein Blick auf die bisher rein englischsprachige Liste zeigt dabei mehr als die bisherigen Dienste: Zahlreiche Bing-APIs sind ebenfalls Bestandteil der Sammlung.

Die APIs sind in folgende Hauptkategorien unterteilt:

  • "Vision" bietet Dienste zur Bildanalyse wie Gesichtserkennung, Videoanalyse und die genannte Emotion API.
  • "Speech" beinhaltet die Bing Speech API, die neben Spracherkennung und Text-to-Speech auch eine Analyse von Spracheingaben enthält, die Eingaben strukturiert aufteilt, um die Bedeutung zu entschlüsseln. Die separate Speaker Recognition API soll die Sprecher erkennen.
  • "Language" enthält unter anderem mit LUIS die API zum Verständnis natürlicher Sprache. Daneben gibt es die Bing-API zur Rechtschreibprüfung und weitere APIs zur Textanalyse.
  • "Knowledge" dient dem Herstellen kontextueller Zusammenhänge zwischen Orten, Personen und auch akademischen Schriften, aber auch persönlichen Kaufempfehlungen mit der Recommendations API.
  • "Search" vereint die Bing-APIs zur Web-, Nachrichten-, Bild- und Videosuche und enthält zusätzlich einen Dienst für automatische Suchvorschläge.

Auf der SDK-Seite finden Entwickler zahlreiche Beispiele und plattformspezifische Bibliotheken für unterschiedliche Sprachen wie JavaScript, C#, Java, Objective-C und Python. Ein Beispiel widmet sich dem Raspberry Pi, der die Gesichtserkennungs-API nutzt und erkannten Personen eine Türe öffnet.

Beim praktischen Einsatz daheim würde eine per Cloud-Gesichtserkennung öffnende Tür vermutlich eher Unbehagen erzeugen. Als Beispiel ist sie jedoch ein spannendes Projekt.

(Bild: Microsoft)

Die SDKs und Beispiele liegen unter der MIT-Lizenz auf GitHub. Für die Cloud-Dienste hat Microsoft nun erstmals eine Preisliste aufgestellt, die Angebote jedoch derzeit nur in US-Dollar aufführt. (rme)