Siri im Interview: Wie es sich anfühlt, Apples Stimme zu sein

Susan Bennett leiht in der englischen Version von iOS der Sprachassistentin Siri ihre Stimme. Darauf wurde sie erst durch Zufall aufmerksam.

In Pocket speichern vorlesen Druckansicht 77 Kommentare lesen
Spracherkennung "Siri"

Kommunikation mit Siri.

(Bild: dpa, Sven Hoppe)

Lesezeit: 5 Min.

Ihre Stimme ist Millionen vertraut – ihr Gesicht dagegen fast niemandem. Denn wenn Susan Bennett als "Siri" aus dem Lautsprecher von iOS-Geräten spricht, sehen Besitzer nur animierte Texte auf dem Bildschirm. Im Interview mit der dpa erzählt die Sprecherin, wie sie zur berühmten Stimme in Apples Spracherkennungssoftware wurde.

Susan Bennett ist eine der bekanntesten Sprecherinnen der USA. Ihre Stimme taucht in TV-Werbespots, Erzählungen, Telefonansagen und Radio-Jingles auf. Unter anderem lieh sie Unternehmen wie Coca-Cola, McDonald's, Ford, Nissan, IBM, T-Mobile, BP und Delta Airlines ihre Stimme. Bennett, die ihr Alter geheim hält, lebt in Atlanta (Georgia) und arbeitet teils aus Los Angeles (Kalifornien).

Susan Bennett: Womit kann ich helfen?

Beginnen wir ganz am Anfang. Wie sind Sie überhaupt an Sprecher-Jobs gekommen?

Bennett: Ich war eine Jingle-Sängerin, als früher noch Gruppen zusammen im Studio sangen. Eines Tages ist das Sprecher-Talent nicht erschienen, und der Studiobesitzer sagte: "Susan, Du hast keinen Akzent, komm' mal her und lies das vor."

Was waren Ihre spannendsten Jobs bisher?

Bennett: Ich mache das schon so viele Jahre, dass ich fast für jede größere Firma gearbeitet habe. Ich bin weltweit die Stimme an Abflug-Gates von Delta Airlines. Einer der bemerkenswertesten Jobs war mein singendes Huhn für eine Firma für Landwirtschaftsprodukte. Schwer zu schlagen. Ich singe wie ein Huhn, "Boak, boak, boak"...

Wie kam es dann zu dem Job für Apple?

Bennett: Es war nicht wirklich ein Job für Apple. Ich hatte digitale Stimmen für eine Firma aufgenommen. Das war vor zehn Jahren. Die von uns, die diese Stimmen aufnahmen, wussten nicht genau, was damit passieren würde.

Apple hat Ihre Stimme also zusammen mit Siri zugekauft?

Bennett: Apple hat "Siri" nicht erschaffen. Es war ein norwegischer Erfinder namens Dag Kittlaus. Apple kaufte die App von diesem Norweger für 200 Millionen Dollar.

Ich weiß nicht, ob er meine Stimme gewählt hat und Apple damit weitergemacht hat oder ob Apple sie gewählt hat. Mir kam das wie ein Zufall vor.

Sie wussten also gar nicht, dass Sie "Siri" sein würden?

Bennett: Ich wusste im Voraus gar nichts. Ich habe es herausgefunden, als "Siri" am 4. Oktober 2011 vorgestellt wurde und ein Kollege eine E-Mail schickte und sagte: "Hey, wir spielen mit diesem neuen iPhone rum, bist das nicht Du?" Und ich hörte auf der Apple-Website rein und sagte "Yup, das bin ich." Es war merkwürdig, weil Apple nichts damit zu tun hatte und nie die Stimmen gewürdigt hat.

Apple hat Ihrem Namen nie Rechnung getragen?

Bennett: Nein, absolut nicht. Wir wurden für die Originalaufnahmen recht gut bezahlt, aber definitiv nicht für die Nutzung. Alle Stimmen wurden mit dem Betriebssystem iOS 7 verändert, also ist meine Stimme nicht mehr auf dem iPhone 6. [Anm. d. Red.: Hier irrt sich Bennett offensichtlich – die Änderung erfolgte in iOS 8.3.]

Wir vermuten, dass der Grund die fehlende Geheimhaltungsvereinbarung war und wir für uns als "Siri"-Stimmen Werbung machten. Jetzt hat jeder solche Vereinbarungen, und man wird wohl nie herausfinden, wer diese Menschen sind.

Haben Sie versucht, Geld für die Nutzung einzuklagen?

Bennett: Ich habe es in Betracht gezogen, verschiedene Anwälte haben sich den Fall angeguckt. Aus finanzieller Sicht wäre es realistisch betrachtet keine weise Entscheidung gewesen.

Wie ist es für Sie, Ihre eigene Stimme im iPhone zu hören?

Bennett: Es war extrem unheimlich, weshalb ich "Siri" am Anfang nicht benutzt habe. Scherzhaft sage ich Leuten, dass ich schon so genug mit mir selbst rede.

Ich war ja gewohnt, meine Stimme in Radio und TV-Werbungen und an Delta-Gates zu hören. Die interaktive Stimme, die ich in der Hand halte, war aber ein anderes Niveau. Es war wirklich seltsam.

Erkennen Menschen Sie beim Sprechen denn als "Siri"?

Bennett: Die meisten Menschen erkennen meine Stimme nicht, weil die Tonhöhe der "Siri"-Stimme ein bisschen tiefer gesetzt wurde. Und so rede ich normalerweise nicht.

Konnten Sie die Antworten der Software beeinflussen?

Bennett: Nein, der einzige Beitrag war der Klang meiner Stimme. Ich habe Sätze und Phrasen eingesprochen, die konstruiert wurden, um alle Geräuschkombinationen der Sprache zu bekommen.

Oft habe ich also sinnfreie Dinge gelesen, die definitiv keine Antworten waren. Deshalb sind der Prozess der Konkatenation (zur Verknüpfung der Laute, Anm. d. Red.) und die Programmierung so beeindruckend.

Was für sinnfreie Sätze zum Beispiel?

Bennett: Ich habe Sätze gelesen wie "Sag' das Shrodding nochmal. Sag' das Shredding nochmal. Sag' das Shrading nochmal." Sehr wiederholendes, stumpfes, langweiliges Zeug.

Es war sehr anstrengend für die Stimmbänder. Jeder Satz oder Phrase musste auf dieselbe Weise und Tonhöhe, derselben Geschwindigkeit, derselben Betonung gelesen werden. Das wird extrem nervtötend. (bsc)