Das ist fast ganz sicher eine Katze: Microsoft Azure-API für die Bilderkennung

Version 4.0 des Microsoft Azure-Dienstes Computer Vision Image Analysis 4.0 macht die weitreichende Bildanalyse über eine einzelne API möglich.

In Pocket speichern vorlesen Druckansicht 5 Kommentare lesen

(Bild: Microsoft)

Lesezeit: 3 Min.

Microsoft hat Version 4.0 des Azure Dienstes Computer Vision Image Analysis als Preview veröffentlicht. Der Cloud-Dienst ermöglicht künftig das Abrufen einer Vielzahl von Bildanalyse-Funktionen über eine einzelne API. Mit dem Update 4.0 bekommt der Dienst einige neue Funktionen wie eine verbesserte Texterkennung (OCR, Optical Character Recognition) und Menschen-Erkennung. Computer Vision Image Analysis ist vor allem für professionelle Zwecke wie Suchmaschinenoptimierung, barrierefreie Darstellung von Bildinhalten über einen alternativen Text oder das automatisierte Moderieren von grafischen Inhalten interessant.

Die größte Neuerung an Microsofts Dienst ist, dass die Image Analysis API nun viele Funktionen mit nur einem Aufruf abarbeitet. Dazu zählen die automatisierte OCR, für die zuvor ein eigener API-Aufruf nötig war, eine Bildbeschriftung, -Klassifizierung und -Markierung (tagging). Außerdem vereinigt die API auch die Objekt- und neuerdings auch eine Personen-Erkennung.

Zwar beherrschte der Dienst Computer Vision auch schon zuvor OCR. Die erwähnte neue Integration in eine API soll die Bedienung aber künftig auch per zentralem User-Interface und in Echtzeit-Szenarien möglich machen. Zudem hat Microsoft Azure die Texterkennung auf nun 164 Sprachen ausgeweitet, sodass der OCR-Dienst jetzt auch Kyrillisch, Arabisch und Hindi versteht. Wie dieser Dienst steht auch die neue "Spatial Analysis" (räumliche Analyse) zunächst als Preview bereit. Mithilfe derer soll es möglich sein, Apps zu entwickeln, die die Anzahl von Menschen in vorbestimmten Räumen zählt – etwa, um Social-Distancing zu gewährleisten oder die Wartezeiten in Kassenbereichen zu messen.

Ebenfalls zunächst nur als Preview und sogar nur einer begrenzten Zahl der Azure-Kundschaft zur Verfügung steht der Azure Face-Dienst. Per KI kann dieser Service menschliche Gesichter "entdecken, erkennen und analysieren". Das könne vor allem für die Identitätsverifikation oder für die Weichzeichnung zum Unkenntlich machen von Menschen nötig sein, so Microsoft. Wegen des sensiblen Analyse-Inhalts ist der Zugriff zunächst denjenigen vorbehalten, die zu Microsofts "managed customers and partners" zählen und nachweisen, dass sie die "Responsible AI"-Prinzipien des Unternehmens einhalten.

Interessierte können die neuen Features der Preview-Version von Computer Vision Image Analysis über Vision Studio im Browser testen – ohne Azure-Account stehen aber nur die Beispielbilder und -Videos von Microsoft zur Verfügung. Zudem steht die Image Analysis ab sofort per Client-Library-SDK oder über die REST-API zur Verfügung. Die Dokumentantion verlinkt Microsoft am Ende des Blogposts.

(jvo)