Echo Show 15: Personenerkennung lässt sich leicht austricksen

Amazons neues Smart Display Echo Show 15 soll Personen an Gesicht und Stimme erkennen. Für eine sichere Kommunikation ist es aber nicht geeignet.

In Pocket speichern vorlesen Druckansicht 22 Kommentare lesen

(Bild: Amazon Devices)

Update
Lesezeit: 4 Min.
Von
  • Nico Jurran

Seit dem vergangenen Donnerstag ist mit dem "Echo Show 15" das jüngste Mitglied der Smart-Display-Familie von Amazon auf dem deutschen Markt. Amazons Sprachassistentin ist wieder an Bord, hat dank integriertem AZ2 Neural Edge"-Prozessor aber eine neue Fähigkeit: Sie kann Nutzerinnen und Nutzer, die die zuvor eine sogenannte “visuelle ID” angelegt haben, erkennen und auf diese mit angepassten Anzeigen auf dem Display reagieren. Das aber funktioniert nicht zuverlässig.

Zu den neuen Funktionen beim Echo Show 15 gehören dabei sogenannte "digitale Haftnotizen" an andere Mitglieder des Haushalts – also die Möglichkeit, mithilfe der visuellen ID eine private Notiz direkt an ein bestimmtes Familienmitglied zu senden. Laut Amazon wird diese "nur angezeigt, wenn Alexa die betreffende Person vor dem Gerät erkennt". Aber ist das wirklich so?

Ich habe das Echo Show 15, das als erstes Modell der Reihe wie ein Bilderrahmen aussieht, bereits an der Wand und meine ersten Erfahrungen ich schon in einem ausführlichen Bericht geschildert. Nun wollte ich auch wissen, wie weit es denn mit der Sicherheit bei der Erkennung der registrierten Personen bestellt ist. Das Ergebnis ist ernüchternd.

Ein mit einem iPad aufgenommenes Selfie reicht, um die Gesichtserkennung des Echo Show 15 zu überlisten.

(Bild: Nico Jurran)

Tatsächlich kann ich die Gesichtserkennung des Echo Show immer wieder zuverlässig mit einem Selfie überlisten, das ich zuvor mit meinem iPad angefertigt habe. Der einfache Trick funktioniert sogar mit einem iPhone XR, hierbei dauert es nur ein wenig länger, den richtigen Abstand zwischen Handy-Display und Kamera des Echo Show 15 zu finden. Deutlich wird aber in jedem Fall, dass das Smart Display nicht auf Tiefeninformationen achtet.

Und das Bild muss nicht einmal neu sein: Wie sich herausstellte, akzeptiert Alexa auch ein mehrere Jahre altes Foto von mir, das ich seinerzeit auch auf Facebook und Instagram geteilt hatte. Da ich darauf in einer Gruppe stehe, muss ich lediglich ein wenig in das Bild hineinzoomen. Am ehesten verweigerte sich das Echo Show 15 im Test, wenn die registrierte Person auf dem Bild eine andere Brille trug als bei der Erfassung oder die Brillengläser zu sehr spiegelten.

Nachdem sich meine Frau testweise mit meinem Bild in meinen Account eingeloggt hatte, konnte sie problemlos an mich gerichtete digitale Haftnotizen abrufen und löschen. Zwar verlangt das Echo Show 15, dass der Empfänger der Notiz neben der visuellen ID auch eine Stimm-ID hinterlegt hat. Nach dessen (vermeintlichen) visuellen Identifizierung lassen sich die Notizen aber einfach über das Touchdisplay abrufen und löschen, ohne dass man dafür sprechen muss.

Im nächsten Schritt versuchte ich wiederum, unter dem Namen meiner Frau eine digitale Haftnotiz zu verschicken. Das klappte beim ersten Anlauf nicht: Obwohl ich offiziell als meine Frau (mit deren Selfie) eingeloggt war, führte der Sprachbefehl "Schicke eine Notiz an..." dazu, dass ich als Absender angegeben wurde. Des Rätsels Lösung: Alexa erkannte mich an der von mir hinterlegten Stimm-ID.

Die Lösung ist so ebenso einfach wie absurd: Ich musste den Sprachbefehl einfach mit verstellter Stimme sprechen, dann erschien der Name meiner Frau als Absender. Wohlgemerkt habe ich mich dabei nicht angestrengt, ihre Stimme zu imitieren, sondern mit einer unnatürlichen Fistelstimme gesprochen. (Ja, Schatz, ich weiß, dass Du so nicht sprichst!) Das Echo Show 15 gleicht folglich die Stimm-ID nicht ab, sondern bemerkt nur, wenn die aktuelle Stimme mit einer anderen hinterlegten Probe übereinstimmt.

Das Fazit ist damit eindeutig: Die Personenerkennung des Echo Show 15 ist eine nette Spielerei für die Übermittlung unbedenklicher Mitteilungen zwischen Familienmitgliedern, eine sichere Kommunikation ist damit aktuell aber nicht einmal im Ansatz möglich.

Update 21.02., 11:45 Uhr: Amazon hat zu den Erkenntnissen aus dem Test der visuellen ID nun folgendes Statement veröffentlicht: "Visuelle ID ist eine neue Funktion, mit der Alexa Bewohner:innen eines Haushalts erkennen und auf dem Bildschirm angezeigte Informationen wie Kalenderereignisse, Erinnerungen, kürzlich abgespielte Musik oder Haftnotizen individuell zuschneiden kann. Visuelle ID wurde nicht als Sicherheits- oder Authentifizierungsfunktion konzipiert." (nij)