Siri-Sprachsteuerung in eigenen Apps

Apples Siri lässt sich auch ohne den Umweg über einen Proxy-Server in Apps integrieren. Die Idee: Siri wandelt Spracheingaben in Text, die Auswertung auf Steuerbefehle hin übernimmt die App selbst.

In Pocket speichern vorlesen Druckansicht 78 Kommentare lesen
Lesezeit: 2 Min.
Von
  • Robert Lippert

Apples Sprachsteuerung Siri als Entwickler für eigene Zwecke zu verwenden, muss nicht zwingend bedeuten, auf einen – von Apple nicht autorisierten – Proxy-Server zu setzen. Den hatte ein Entwickler ursprünglich programmiert, um Siri auch auf anderen Geräten als dem iPhone 4S nutzen zu können. Ein jetzt vorgestellter alternativer Ansatz hilft zwar nicht, die Sprachsteuerung direkt auf anderen Geräten zu verwenden, erlaubt es Entwicklern aber immerhin, die Technik in eigene iPhone-4S-Apps zu integrieren. So könnten künftig auch Drittanbieter-Anwendungen Siri als Verkaufsargument im App Store nutzen.

Bisher konnten Apps wie die Aufgabenverwaltungen "Remember The Milk" und "OmniFocus" Siri nur über Umwege ansprechen – und beispielsweise mit Siri erfasste Aufgaben per Synchronisierung importieren. Erst der iOS-VNC-Client iTeleport bot eine rudimentäre Integration des Dienstes. Erica Sadun, Computerwissenschaftlerin und Autorin beim Onlinemagazin TUAW, scheint nun etwas Licht auf den Ansatz werfen zu können und hat eine Methode gefunden, den Prozess zu beschleunigen.

Die Idee erscheint zunächst trivial. Siri wird aus der App heraus über eine nicht dokumentierte UIDictationController-Klasse angesprochen. Die Spracherkennung wird anschließend ganz regulär über Siri abgewickelt, der Service liefert der Anwendung die gesprochenen Eingaben als Text zurück. Der Trick: Die App wertet den von Siri zurückgelieferten Text selbst aus (um z. B. bestimmte Steuerbefehle zu interpretieren) und setzt die erkannten Kommandos dann um. In einer Beispielanwendung demonstriert Sadun das Verfahren, hier steuert sie die Animation eines kleines Quadrates über Sprachkommandos wie "flip to the left" oder "flip to the right". Ihre App wertet den von Siri aus den Spracheingaben generierten Text aus und animiert das Quadrat entsprechend.

Ein weiterer Vorteil des Ansatzes ist es laut Sadun, dass er die Vorgaben des App Stores nicht zwingend verletze. Anders als bei der Methode mit dem Proxy-Server dürften Anwendungen somit eine realistische Chance haben, für eine Veröffentlichung im Store freigegeben zu werden. (rl)