Der kleine Lauschangriff

05. Juli 2015 Oliver Bendel

Auditive Systeme aus Sicht der Ethik

Der folgende Beitrag ist vor 2021 erschienen. Unsere Redaktion hat seither ein neues Leitbild und redaktionelle Standards. Weitere Informationen finden Sie hier.

Das gesprochene Wort ist seit jeher Objekt der Begierde, nicht erst seit dem Kalten Krieg und der Arbeit des Ministeriums für Staatssicherheit der DDR, von der Bevölkerung auch "Horch und Guck" genannt. Das lautlose Anschleichen und hemmungslose Mitlauschen gehört in jeden Indianerfilm und in jede Intrige. Während "Guck" aus der Ethik heraus recht umfassend behandelt wurde, bedarf "Horch" noch eines genaueren Hinsehens bzw. -hörens, gerade im 21. Jahrhundert, und nicht nur in Bezug auf Staatsapparate, Strafverfolgungsbehörden und Nachrichtendienste, sondern auch und insbesondere in Bezug auf Privatpersonen und Unternehmen, die sozusagen den kleinen Lauschangriff erproben.

Sprach- und Tonsysteme erobern die Welt, sei es in Form von Lautsprechersäulen, intelligenten Fernsehern, Mobilgeräten wie Smartphones und Tablets und darauf installierten Assistenten, intelligentem Spielzeug sowie Datenbrillen und Drohnen, die Mikrofone besitzen. Die Ethik, ob Informations- oder Technikethik, kann Probleme wie den Verlust der informationellen und persönlichen Autonomie identifizieren.

Die Neugier der Geräte

Auditive Ein- und Ausgabegeräte haben eine lange Geschichte. Aus Detektivbüchern, Spionagefilmen und der jüngeren deutschen Geschichte sind Wanzen bekannt, über die man Verdächtigte und Verdächtige in ihren Wohnungen und Hotelzimmern observierte (Piper 2015). Kassettenrekorder haben noch die Kindheit der Älteren bestimmt, und man hat damit nicht nur Musik, sondern auch Gespräche und Vorträge mitgeschnitten und angehört.

Mit dem Einzug der digitalen Technologien und Systeme in den privaten und beruflichen Alltag standen immer mehr Schnittstellen zur Verfügung, ohne dass am Anfang schon exzessiv Gebrauch von ihnen gemacht wurde. Diktiergeräte verbreiteten sich bei Juristen und Ärzten und bei allen, die das Mündliche schnell und ohne Tastatur und Maus zu benutzen ins Schriftliche verwandeln wollten. Musikanwendungen erlaubten das Produzieren von mehr oder weniger gelungenen Songs. Zugleich wurden Speicher und Prozessoren immer kleiner, günstiger und leistungsfähiger. Es konnten enorme Mengen an Daten gesichert und ausgewertet werden.

Im vorliegenden Beitrag stehen solche Funktionen und Gadgets im Vordergrund, die (zumindest zunächst) nicht der bewussten, benutzergesteuerten Aufzeichnung von Tönen bzw. Inhalten dienen, und die Möglichkeiten der Überwachung und der Datenanalyse bieten. Diktiergeräte und Musikprogramme werden demnach ausgeklammert. Erstere wären auch dazu geeignet, Gespräche zu belauschen; auf diese Möglichkeit kann indes bei den Smartphones eingegangen werden. Smartwatches werden nicht thematisiert, da sie oft mit Smartphones zusammenwirken und teils ähnliche bzw. entliehene Funktionen haben. Auch Standrechner und Notebook werden nicht herangezogen, da die Probleme grundsätzlich die gleichen wie bei Smartphones und Tablets sind. Smart Toys wie Hello Barbie verdienen einen eigenen Beitrag. Gier und Neugier der Geräte sollen zunächst an konkreten Beispielen aufgezeigt werden.

Smartphone und Tablets

Smartphones und Tablets verfügen üblicherweise über Mikrofon und Lautsprecher. Das Mikrofon ist für Aufnahmen von Geräuschen und Klängen, für die Sprachsteuerung sowie für die Spracheingabe beim Telefonieren gedacht, der Lautsprecher gibt Signale, Weckrufe, Musik und Sounds von Computerspielen sowie die Stimme des Gesprächspartners am anderen Ende aus. Zusätzlich können Kopfhörer oder Headsets und separate Boxen angeschlossen werden. Auch Handys haben oft die beschriebenen Funktionen, und natürlich muss jedes Telefon über eine Spracheingabe und -ausgabe verfügen.

Smartphones und Tablets werden überall genutzt, unterwegs, im Zug oder im Bus, bei der Arbeit und zu Hause. Auch im Schulunterricht und bei Vorlesungen sind sie massenhaft zu finden. Sie sind, mit anderen Worten, omnipräsent, und der Benutzer weiß oft nicht, ob die Aufnahmefunktion aktiviert wurde, zumal dies durch einen Bedienungsfehler passieren kann. Pakalski (2015) konstatiert, dass über Schadsoftware vorgegaukelt werden kann, dass das Smartphone ausgeschaltet ist, und in diesem Zustand ein Lauschangriff droht. Auch Personen im Umfeld können in der Regel nicht eruieren, ob ihre auditiven Aktivitäten aufgezeichnet werden oder nicht. Die Aufnahme erfolgt sozusagen heimlich, still und leise, meist ohne ausdrückliches Einverständnis der Betroffenen.

Die auditiven Funktionen von Smartphones und Tablets können von Sprachassistenten genutzt werden. Siri und Cortana sind zwei bekannte Beispiele. Sie haben menschliche Stimmen und kommunizieren in natürlicher Sprache, ähnlich wie Chatbots auf Websites, die aber meist nur textuell interagieren, oder pädagogische Agenten in Lernumgebungen. Ein weiteres Beispiel ist OK Google. Mit dem gleichnamigen Befehl wird die (Such-)Maschine aktiviert, und eine künstliche Stimme beantwortet Fragen, etwa auf der Basis von Wikipedia. Andere Quellen sind Websites aller Art, die über eine Suchfunktion gefunden werden, und Datenbanken, die automatisch oder von Inhalteerstellern gefüllt werden.

Lautsprechersäulen

Lautsprecher waren früher meist, durchaus im Sinne ihrer wörtlichen Bedeutung, keine Ein-, sondern Ausgabegeräte. Spätestens mit Amazons Echo - Nomen est omen - hat sich die Situation geändert (Hill/Harshaw 2015). Das Gerät, das wie ein normaler Lautsprecher aussieht, kann mit Sprachbefehlen und mit einer App gesteuert werden. Es ist über W-LAN permanent mit dem Internet verbunden und verfügt über sieben Mikrofone im Boden (Linden 2014). Die Sprachanalyse findet gemäß dieser Quelle in Amazons Rechenzentren statt. Laut dem Unternehmen wird sie nur bei vorangehendem Codewort durchgeführt; "sonst wird von Echo nichts aufgezeichnet" (Linden 2014). Das Codewort ist der nicht ganz ungebräuchliche Mädchenname "Alexa".

Fragen nach dem Wetter werden von Echo ebenso beantwortet wie nach dem Radio- oder Fernsehprogramm. Auch kann man sich Witze erzählen, Nachrichten vorlesen, To-do-Listen generieren und an Termine erinnern lassen (Fuest 2014). Das ausschnittsweise Vorlesen von Wikipedia-Artikeln wird - wie von OK Google - ebenfalls beherrscht. Vor allem hilft die erweiterte Lautsprechersäule beim Shoppen zu Hause: "Per Zuruf können Nutzer Produkte auf die Einkaufsliste setzen oder Musik aus Amazons Multimedia-Angeboten abrufen." (Fuest 2014) Damit wurde, auch von der Optik her, eine Art digitale Litfaßsäule realisiert, die zugleich ein Vorschlags- und Bestellsystem ist.

Die häusliche Situation ist eine besondere. Man befindet sich in den eigenen vier Wänden, normalerweise nicht der Ort für Überwachung und Abhörung, außer wenn man im Visier von Geheimdienst oder Polizei bzw. unter "Beobachtung" des Partners ist. Die Lautsprechersäule kann Geräusche und Anweisungen erfassen, die von einem beliebigen Ort der Wohnung oder Etage kommen. Amazon nennt dies in seinem Einführungsvideo "Introducing Amazon Echo" auf YouTube "far-field technology". Die Devices können im Prinzip auch in Büro- und Arbeitsräumen sowie im Freien aufgestellt werden. Ein Leuchtring am Kopf zeigt die Aktivität von Echo an. Dies ist für den Nichteingeweihten aber nicht unbedingt offensichtlich.