c't 24/2016
S. 64
Test
Amazon Alexa
Aufmacherbild

Hallo, Echo?

Sprachgesteuerte Lautsprecher Amazon Echo und Echo Dot

Ab sofort gibt es Amazons digitale Sprachassistentin Alexa auch in Deutsch. Sie steuert das Smart Home, beantwortet Fragen, spielt Musik, shoppt bei Amazon, kennt den Wetterbericht, stellt den Wecker, rezitiert Wikipedia-Einträge …

Knapp zwei Jahre nach dem US-Start hat Amazon seine sprachgesteuerten Netzwerklautsprecher auch nach Deutschland gebracht. Zum Europastart bietet Amazon den 180 Euro teuren Echo nicht nur Schwarz, sondern auch in Weiß an. Außerdem gibt es in den USA, Großbritannien und Deutschland für 60 Euro eine überarbeitete Version des kleinen Bruders Echo Dot. Anders als beim Echo verstellt man die Lautstärke nicht mittels eines Rings am Rand der Oberseite, sondern über zwei Taster.

Video: Amazon Alexa: erste deutsche Kontaktaufnahme

In der Echo-Röhre steckt eine Kombination aus 15-Watt-Verstärker (TI TPA3110D2 Class D) und Zwei-Wege-Lautsprecher mit Downfire-Subwoofer, die einen ordentlichen Eindruck hinterlässt: Der volle Klang liegt auf dem Niveau besserer Bluetooth-Lautsprecher, solange man Echo nicht bis zum Anschlag aufdreht. Doch auch der kleine Bruder ist nicht stumm: Dessen winziger Lautsprecher taugt zur Sprachausgabe und gibt auch Musik wieder. Wem der Mager-Sound des Echo-Pucks nicht reicht, kann ihn per 3,5-mm-Klinkenbuchse an ein Audiosystem anschließen oder digital über Bluetooth (A2DP) einen Aktivlautsprecher ankoppeln; zur Übertragung nutzt er den betagten SBC-Codec. Der große Echo kann Bluetooth-Signale nur empfangen – etwa Musik vom Smartphone. Weder Echo noch Dot unterstützen das Hands Free Profile (HFP), taugen also nicht als Freisprechanlage fürs Telefonieren.

Beide Geräte werden über mitgelieferte Netzteile mit Strom versorgt – der in den USA angebotene mobile Amazon Tap ist hierzulande nicht erhältlich. Wer ein US-Gerät importiert, kann es jedoch auf Deutsch umschalten.

Gespitzte Ohren: Ein aus sieben Mikrofonen bestehendes Array sorgt dafür, dass Echo (Dot) auch leise Sprachbefehle erlauscht.

Die zur Konfiguration benötigte Alexa-App gibt es für Android und iOS. Die Ersteinrichtung der Echos ist schnell erledigt: Netzteil anschließen, den Anweisungen der App folgen, um Echo den mit dem persönlichen Amazon-Konto und übers WLAN mit dem Internet zu verbinden – schon kann man mit Alexa sprechen.

Dauerlauscher

In der Voreinstellung lauschen Echo und Dot permanent auf das eingestellte Wakeword („Alexa“, „Amazon“ oder „Echo“). Erkennen die Geräte das Wakeword, wird das folgende Sprachkommando zur Auswertung in die Amazon Cloud übertragen – und dort gespeichert; das gilt übrigens auch für die Sprachbefehle des Fire TV (Stick). In der Alexa-App kann man die gespeicherten Clips anhören und außerdem sehen, wie Alexa die Eingabe interpretiert hat. An dieser Stelle hat Amazon eine Feedback-Option vorgesehen, über die man eine Fehlerkennungen melden kann. Die Sprachdaten lassen sich im Nutzerprofil über Einstellungen/Alexa-Geräte/Verlauf auch einzeln löschen. Laut Amazon kann das Löschen jedoch das „Alexa-Erlebnis abwerten“.

Zum Kasten: Verfügbarkeit

Dass Alexa aktiv ist, signalisieren beide Geräte mit einem leuchtenden LED-Kreis aus 12 RGB-Segmenten am Rand der Gehäuseoberseite. Ein farblich hervorgehobenes Kreiselement zeigt an, aus welcher Richtung das eingebaute Array aus sieben Mikrofonen die Stimme registriert hat – der Echo (Dot) wendet sich so seinem Gegenüber zu; besitzt man mehrere Echos, hören für einen kurzen Moment alle Geräte in Hörweite zu, dann wird die Anfrage an das nächstliegenden übergeben. Wenn man das Mikrofon-Array stummschaltet, ist es laut Amazon hart deaktiviert. Das dürfte jedoch die Bedenken von Datenschützern kaum zerstreuen, die den Cloud-gestützten Assistenten wie Alexa & Co. skeptisch gegenüberstehen.

Alexa, sprich Deutsch!

Die deutsche Stimme von Alexa klingt nicht ganz so rund wie die des US-Originals – mitunter spricht sie falsch betont und abgehackt. Die Stimme wird halbsynthetisch erzeugt, von einer realen Person eingesprochene Fragmente dienen als Grundlage für die Sprachausgabe. Viele Fragen, die die US-Alexa beantworten kann, laufen bei der deutschen Schwester noch ins Leere. Ein deutsch/englischer Mischbetrieb ist nicht möglich. Man kann die Sprache jedoch zwischen US-Englisch, britischem Englisch und Deutsch umschalten.

Die Spracherkennung klappt erstaunlich gut. Umgebungsgeräusche und von Echo selbst abgegebene Klänge – wie etwa parallel laufender Musikwiedergabe – werden effektiv herausgefiltert. Das klappt sogar, wenn der große Echo bei voller Lautstärke dröhnt.

Von „Erkennen“ zu „Verstehen“ ist es jedoch ein großer Schritt. „Ich will mich umbringen“ entlockt Alexa nur ein verbales Schulterzucken. Bei „Ich will mich töten“ rappelt sie die Nummer der Telefonseelsorge herunter. Im Hintergrund liegt ein festes Set von Sprachbefehlen, das derzeit die Grenzen der „künstlichen Intelligenz“ markiert. Alexa „versteht“ also nur dann gut, wenn man die korrekten Sprachbefehle und Keywords nutzt: „Alexa, wird es morgen regnen?“, „… stell den Wecker auf 7 Uhr 30“, „… spiel NDR2 auf TuneIn“, „… was steht heute in den Nachrichten“ sind mögliche Formulierungen. Spätestens bei der Eingabe eines Termins muss dann wieder alles hübsch in der richtigen Reihenfolge eingesprochen werden, damit Alexa in einem Rutsch alles begreift.

Smart Home

Anfangs konnten die Echos lediglich funkgesteuerte Lampen (Philips Hue) und Steckdosen ansteuern, die einzeln oder in Gruppen geschaltet respektive gedimmt werden konnten. Beispielhafte Sprachbefehle zur Lichtsteuerung sind: „Alexa, schalte das Küchenlicht an“ oder „Dimme Esszimmer auf 20 Prozent“. Die Gerätenamen („Esszimmerlampe“) und gemeinsam zu schaltende Gruppen (etwa „Wohnzimmer“) legt man für die unterstützten Geräte im Smart-Home-Bereich der Alexa-App oder nach Anmeldung über die Webseite alexa.amazon.de fest.

Sehr praktisch ist die „Tägliche Zusammenfassung“, über die Alexa auf Zuruf einen personalisierten Nachrichtenüberblick gibt. Zur Wahl stehen Infos von Tagesschau in 100 Sekunden, Spiegel online (von Alexa vorgelesen), Bild, Nachrichten und Presseschau vom DLF, ntv, Kicker, Sky Sports und anderen. Die Channels lassen sich einzeln aktivieren und mit einem Wetterbericht „krönen“. Die Reihenfolge des Briefings lässt sich derzeit nicht beeinflussen.

Begrenzter Funktionsumfang

Damit Alexas Funktionsumfang wächst, hat Amazon die Alexa Voice Services (AVS) für Dritte geöffnet, das passenderweise ASK genannte Alexa Skills Kit bereitgestellt und die Entwicklung der sogenannten „Alexa Skills“ mit 100 Millionen US-Dollar angeschoben. Über ASK lassen sich übers Web relativ einfach Dienste mit Alexa anzapfen. Die Skills lassen sich vom Nutzer einzeln über die Alexa-App oder die Webseite aktivieren.

Inzwischen haben viele Hersteller das Potenzial von Amazons Sprechdose erkannt und entsprechende Skills bereitgestellt. Zum Start gibt es hierzulande Skills von Philips Hue, Magenta Smart Home, Netatmo, Innogy, Honeywell evohome, Digitalstrom, Venstar, Tado, TP-Link und Lifx. Philips’ Hue-System wird auch ohne Skill erkannt, eine Basisunterstützung ist in der Firmware verankert. Erst eine Hue Bridge Gen2 mit aktivierter Skill ermöglicht auch das Ansteuern von Lichtszenen.

If This Then That (IFTTT), eine der beliebtesten Spielwiesen für Smart-Home-Enthusiasten, wird derzeit nur in den USA unterstützt. Yonomi ist bisher der einzige „Meta-Dienst“, der verschiedene Plattformen verknüpft und auch hierzulande verfügbar ist.

Tabelle
Tabelle: Amazon Echo / Echo Dot

Einige Skills werden über zusätzliche Rufnahmen aktiviert. Anfragen zu Zugverbindungen muss man über „Deutsche Bahn“ aktivieren, den BMW-Connected-Skill über „BMW“ oder eine Telefonbuchanfrage über „Das Örtliche“. Die zusätzlichen Rufnahmen machen die Eingabe korrekter Sprachbefehle umständlich: „Alexa, sage Magenta Smart Home, dass es die Situation TV-Abend ausschaltet“. In den USA beherrscht Alexa inzwischen rund 3000 solche „Skills“, in Deutschland sind es sprachbedingt momentan nur 33. Umschalten der Sprache ändert nichts daran, dass man bei einem deutschen Gerät aktuell nur auf den Katalog der deutschsprachigen Skills zugreifen kann.

Fazit

Wer sich auf die dauerhaft lauschende Wanze im Wohnzimmer einlässt, hat viel Spaß mit Alexa. Die Spracherkennung funktioniert zuverlässig, man muss sich jedoch derzeit noch viel „Alexa-Sprech“ angewöhnen, obwohl sich viele eine natürliche Ansprache wie beim Computer der Enterprise wünschen. Wie sich das System weiterentwickelt, ist ungewiss: Einerseits hat Amazon den „Alexa Prize“ ausgeschrieben, von dem sich das Unternehmen Fortschritte für die Konversationstechnik seiner künstlichen Intelligenz erhofft. Andererseits arbeitet Amazon angeblich an deutlich formelhafteren Sprachbefehlen, um Anforderungen des Datenschutzes zu genügen – denn je klarer die Befehle, desto weniger muss in die Cloud übertragen und analysiert werden.

(sha@ct.de/vza@ct.de)