Bilderkennung: Google Cloud Vision beginnt Betaphase
Die API bietet Funktionen zur Bildanalyse wie Gesichtserkennung und OCR. Gleichzeitig will sie wie Google SafeSearch helfen, unangemessenes Bildmaterial auszufiltern. Das kommerzielle Angebot startet ab 1. März.
Wie andere Internetplattformen verwendet Google intern zahlreiche Funktionen zur Bilderkennung, um Personen und Objekte auf Fotos zu identifizieren und Texte auszulesen. Nun bietet der Internetriese mit der Google-Cloud-Vision-API diverse Funktionen als Dienst an. Dazu gehören das Erkennen von Gemütszuständen anhand des Gesichtsausdrucks, OCR (Optical Character Recognition) zur Texterkennung, und das aus Google Photos bekannte Zuordnen von Settings wie See, Wandern, Schnee oder Spielplatz.
Betreiber einer Bilderplattform, die das Hochladen von nicht jugendfreien Inhalten vermeiden wollen, können die gleichen Funktionen verwenden wie Google SafeSearch. Damit bietet der Konzern Kunden offensichtlich viele der Funktionen so an, wie er sie intern selbst nutzt. Im Dezember hatte Google eine geschlossene Preview gestartet und öffnet nun die API zunächst als Beta.
Ähnliche Angebote gibt es unter anderem von Microsoft, die im November 2015 die Erkennung von Emotionen als Bestandteil des Project Oxford eingeführt hatten. Auch IBMs Watson-API verfügt über Bildanalysefunktionen. Der Blog-Beitrag zum Start der Betaphase der Google-Cloud-Vision-API nennt auch erste Preise, die von der gewählten Funktion abhängen. So kostet beispielsweise OCR für 1000 Bilder 60 US-Cent. (rme)