Maschinelles Lernen: Microsoft teilt Project Oxford auf
Die Funktionen des Cloud-Dienstes wie Bildanalyse und Verständnis natürlicher Sprache sind künftig als separate Module verfügbar. Hinzu kommen weitere Dienste wie die Bing-Search-APIs.
![Microsoft teilt Project Oxford auf](https://heise.cloudimg.io/width/610/q85.png-lossy-85.webp-lossy-85.foil1/_www-heise-de_/imgs/18/1/8/5/1/3/2/0/jd-e103f8a7a49fb8a1.jpeg)
Im Frühjahr 2015 hatte Microsoft Project Oxford als eine Sammlung von Cloud-Diensten veröffentlicht, die maschinelles Lernen für diverse Analysefunktionen verwenden. Entwickler verbinden ihre Software über plattformspezifischen SDKs mit dem Cloud-Angebot, das passende REST APIs zur Verfügung stellt. Im Lauf des Jahres kamen unter anderem ein Dienst zum Verständnis natürlicher Sprache und einer zum Erkennen von Emotionen auf Gesichtern hinzu.
Bing an Bord
Nun hat Microsoft das Projekt in einzelne Module aufgeteilt, und der Link auf die alte Website führt zu den neuen Diensten, die "Cognitive Services" heißen. Ein Blick auf die bisher rein englischsprachige Liste zeigt dabei mehr als die bisherigen Dienste: Zahlreiche Bing-APIs sind ebenfalls Bestandteil der Sammlung.
Die APIs sind in folgende Hauptkategorien unterteilt:
- "Vision" bietet Dienste zur Bildanalyse wie Gesichtserkennung, Videoanalyse und die genannte Emotion API.
- "Speech" beinhaltet die Bing Speech API, die neben Spracherkennung und Text-to-Speech auch eine Analyse von Spracheingaben enthält, die Eingaben strukturiert aufteilt, um die Bedeutung zu entschlüsseln. Die separate Speaker Recognition API soll die Sprecher erkennen.
- "Language" enthält unter anderem mit LUIS die API zum Verständnis natürlicher Sprache. Daneben gibt es die Bing-API zur Rechtschreibprüfung und weitere APIs zur Textanalyse.
- "Knowledge" dient dem Herstellen kontextueller Zusammenhänge zwischen Orten, Personen und auch akademischen Schriften, aber auch persönlichen Kaufempfehlungen mit der Recommendations API.
- "Search" vereint die Bing-APIs zur Web-, Nachrichten-, Bild- und Videosuche und enthält zusätzlich einen Dienst für automatische Suchvorschläge.
SDKs für diverse Plattformen und Sprachen
Auf der SDK-Seite finden Entwickler zahlreiche Beispiele und plattformspezifische Bibliotheken für unterschiedliche Sprachen wie JavaScript, C#, Java, Objective-C und Python. Ein Beispiel widmet sich dem Raspberry Pi, der die Gesichtserkennungs-API nutzt und erkannten Personen eine Türe öffnet.
(Bild: Microsoft)
Die SDKs und Beispiele liegen unter der MIT-Lizenz auf GitHub. Für die Cloud-Dienste hat Microsoft nun erstmals eine Preisliste aufgestellt, die Angebote jedoch derzeit nur in US-Dollar aufführt. (rme)