Bilderkennung: Google Cloud Vision beginnt Betaphase

Die API bietet Funktionen zur Bildanalyse wie Gesichtserkennung und OCR. Gleichzeitig will sie wie Google SafeSearch helfen, unangemessenes Bildmaterial auszufiltern. Das kommerzielle Angebot startet ab 1. März.

1

19.02.2016, 11:22 Uhr

Lesezeit: 1 Min.

Developer

Von

Rainald Menge-Sonnentag

Wie andere Internetplattformen verwendet Google intern zahlreiche Funktionen zur Bilderkennung, um Personen und Objekte auf Fotos zu identifizieren und Texte auszulesen. Nun bietet der Internetriese mit der Google-Cloud-Vision-API diverse Funktionen als Dienst an. Dazu gehören das Erkennen von Gemütszuständen anhand des Gesichtsausdrucks, OCR (Optical Character Recognition) zur Texterkennung, und das aus Google Photos bekannte Zuordnen von Settings wie See, Wandern, Schnee oder Spielplatz.

Die API will Stimmungen von Menschen und Inhalte von Texten gleichermaßen erkennen.

(Bild: Google)

Betreiber einer Bilderplattform, die das Hochladen von nicht jugendfreien Inhalten vermeiden wollen, können die gleichen Funktionen verwenden wie Google SafeSearch. Damit bietet der Konzern Kunden offensichtlich viele der Funktionen so an, wie er sie intern selbst nutzt. Im Dezember hatte Google eine geschlossene Preview gestartet und öffnet nun die API zunächst als Beta.

Ähnliche Angebote gibt es unter anderem von Microsoft, die im November 2015 die Erkennung von Emotionen als Bestandteil des Project Oxford eingeführt hatten. Auch IBMs Watson-API verfügt über Bildanalysefunktionen. Der Blog-Beitrag zum Start der Betaphase der Google-Cloud-Vision-API nennt auch erste Preise, die von der gewählten Funktion abhängen. So kostet beispielsweise OCR für 1000 Bilder 60 US-Cent. (rme)