Gutes KHARMA für die Erkundung der Welt
Ein neuer offener Standard für Augmented-Reality-Anwendungen will die Überlagerung von Live-Bildern mit Zusatzinformationen auf bekannten Webtechnologien aufbauen und so zur Mainstream-Technologie machen.
- Christopher Mims
Ein neuer offener Standard für Augmented-Reality-Anwendungen will die Überlagerung von Live-Bildern mit Zusatzinformationen auf bekannten Webtechnologien aufbauen und so zur Mainstream-Technologie machen.
Wer mit einem Smartphone unterwegs ist, kann heute auf diverse ortsbezogene Anwendungen zurückgreifen. Noch relativ neu unter diesen ist die so genannte Augmented Reality (AR): die Überlagerung einer Szenerie mit computergenerierten Zusatzinformationen in Echtzeit. Eine Forschungsgruppe des Georgia Institute of Technology will der AR-Technologie nun mit einem neuen offenen Standard zum Durchbruch verhelfen.
Ähnlich wie im Internet der frühen Neunziger setzen die bisherigen AR-Anwendungen auf firmeneigene Datenformate, um Live-Handybilder etwa des Brandenburger Tors mit touristischen Informationen anzureichern. Das hat zur Folge, dass AR-Apps verschiedener Hersteller sich nur für eine Aufgabe wie einen interaktiven Stadtführer nutzen lassen. Für jede weitere Funktion ist eine weitere AR-App nötig.
Die Georgia-Tech-Gruppe will deshalb auf Basis heutiger Web-Datenprotokolle einen standardisierten AR-Browser entwickeln. Mit ihm sollen Nutzer unterschiedlichste Anwendungen der Erweiterten Realität laden können – unabhängig davon, wer sie anbietet. „Wir sind bisher die einzigen, die versuchen, direkt auf der Webarchitektur aufzusetzen“, sagt Blair Macintyre, Direktor des Augmented Environment Lab am GeorgiaTech.
Der neue Standard firmiert unter der Bezeichnung „KML/HTML Augmented Reality Mobile Architecture“ oder kurz: KHARMA. Er kombiniert verschiedene offene Formate, die seit langem genutzt werden. Neben den Arbeitspferden HTML und Javascript gehört dazu KARML, eine Weiterentwicklung der Keyhole Markup Language KML. Mit dieser können in Google Earth Orte auf der Erdkugel mit Zusatzinformationen versehen werden.
In KARML verfasste Inhalte werden von "Channelservern" geladen, auf denen die Inhalte liegen, die eingeblendet werden. Dabei können auch Informationen aus mehreren Quellen, die jeweils einen eigenen Channelserver darstellen, zusammengeführt werden. Bisherige AR-Anwendungen arbeiten nur mit einziger Datenquelle. Auf diese Weise sollen auch populäre Dienste wie Twitter integriert werden.
Die räumlichen Modelle von Gebäude und Straßen, mit denen die Live-Bilder abgeglichen werden, liegen wiederum im KHARMA-Framework auf standardisierten „Infrastruktur-Servern“. Während die Channelserver die Zusatzinformationen vorhalten, liefern die Infrastruktur-Server also das Computermodell der Szenerie, die mit den Informationen ergänzt werden. App-Entwickler können die Zusatzinformationen etwa zu einer Kathedrale vorab mit deren 3D-Modell verknüpfen, die Nutzer später in Echtzeit die Modelle auf den Infrastrukturservern mit Kommentaren versehen.
Zur Demonstration des KHARMA-Konzepts haben die GeorgiaTech-Ingenieure den AR-Browser „Argon“ entwickelt. Der funktioniert vorerst nur auf dem iPhone. Sobald Argon stabil laufe, werde der Quellcode offengelegt, verspricht Macintyre.
„Ich hoffe, dass unsere Arbeit in drei Jahren Bestandteil von Webkit geworden ist“, sagt Macintyre. Webkit ist die Open-Source-Kernsoftware, auf der die Browser Safari und Chrome aufbauen, die zu den führenden Smartphone-Betriebssystemen iOS und Android gehören. „Wenn unser Projekt dann nicht mehr existiert, haben wir Erfolg gehabt“, witzelt der Informatiker.
Dass KHARMA so schnell zum neuen Standard werden könnte, bezweifeln manche AR-Forscher allerdings. Für Avideh Zakhor von der University of California in Berkeley ist die Zeit noch nicht reif, jetzt schon Standards setzen zu wollen. „Die Technologie steckt noch in den Anfängen und hat gewichtige Probleme zu lösen“, so Zakhor.
Die Ingenieurin konzentriert sich in ihrer Arbeit darauf, erst einmal wirklich überzeugende AR-Ansichten zu schaffen. Mit Hilfe von Bilderkennungsalgorithmen will ihre Gruppe den Standort des Nutzers aus Live-Kamerabildern errechnen und dann pixelgenau mit Texten, Oberflächen oder Bildern auf Live-Kamerabildern überlagern. Heutige AR-Apps arbeiten hingegen mit GPS-Koordinaten und Ortsdaten aus Mobilfunkzellen, um die jeweilige Position zu ermitteln.
Weil diese Form der Lokalisierung noch immer ungenau ist, setzen die KHARMA-Entwickler auf so genannte Geospots. Befindet sich ein Nutzer auf einem dieser Referenzpunkte eines Stadtplans, bestätigt er diesen. Die AR-Ansicht, die dann folgt, ist damit auf bekannte Koordinaten geeicht. Der AR-Browser Argon sei aber so ausgelegt, dass sich Bilderkennungsalgorithmen integrieren ließen, versichert Macintyre.
Eine offene Frage ist derzeit, wie überhaupt die „Killer App“ für die Erweiterte Realität aussehen könnte. Das herauszufinden, sei eines der Ziele des Argon-Browsers, entgegnet Hafez Rouzati, leitender Entwickler von Argon. Die Stärke des Webbrowsers sei ja gerade seine Vielseitigkeit gewesen, er eigne sich für Medieninhalte, Onlineshops und Kommunikation gleichermaßen. Genauso flexibel lege man Argon an. „Wir ermöglichen damit den Leuten, uns zu zeigen, was für sie wichtig ist. Unsere eigene Vorstellungskraft ist auch nur begrenzt“, sagt Rouzati.
(nbo)