Smart, aber nicht smart genug

Inhaltsverzeichnis

Noch weiter geht die Vision im Projekt "Semantisches Produktgedächtnis", kurz SemProM, das 2008 vom Bundesforschungsministerium initiiert wurde. Die Idee: Jedes Produkt speichert ständig Informationen über seine Umgebungsbedingungen und tauscht sich aktiv mit der Umwelt darüber aus. Das Prinzip kann in der Logistik verwendet werden, aber auch in der Produktion: Das Werkstück selbst "treibt die Produktion", teilt also einem Roboter mit, wohin es transportiert werden muss, und der sagt der Produktionsanlage, wie es bearbeitet werden soll. Dieser Ansatz macht ein Gesamtsystem zwar sehr robust und flexibel, weil eine zentrale Steuerung nicht mehr nötig ist, doch die Anforderungen werden noch höher: Der autonome, flexible Roboter für die Werkstatt oder Fabrik von morgen muss über künstliche Intelligenz verfügen.

Die Roboterplattform für dieses Projekt entwickelte das DFKI-Labor Bremen. Der erste Prototyp des SemProM-Roboters, vorgeführt zur Hannover Messe 2008, stand noch fest montiert auf einem Träger. Doch 2010 wollen die Bremer Forscher mit dem ersten mobilen System antreten – im Gewand einer Frau. Der besondere Clou der Roboterdame namens Aila sind die am DFKI eigens entwickelten Leichtbau-Arme: Bei einem Gewicht von rund sechs Kilogramm können sie etwa acht Kilo Gewicht heben; verglichen mit anderen Systemen ist das ein echtes Rekordverhältnis. Noch sind die Arme mit ihren sieben Freiheitsgraden an einen quasi starren Rücken montiert. Doch im nächsten Schritt wollen die DFKI-Forscher die Anbindung über eine Art flexibler Schulterblätter realisieren. Damit wäre die Maschine in der Lage, eine "beidarmige Manipulation von nicht statischen Objekten" zu meistern – zum Beispiel beim Heben von Kaffeesäcken, in denen die Kaffeebohnen verrutschen und sich dadurch der Schwerpunkt verlagert.

Das Ziel ist klar: Wenn das Objekt zu schwer ist oder in sich flexibel, soll die Maschine dieses Problem erkennen und das Objekt mit der zweiten Hand unterstützen. Doch das ist einfacher gesagt als getan: Seit gut fünfzig Jahren arbeitet die KI-Forschung mittlerweile an dieser und ähnlichen Fragen, die sich für die Robotik als harte Nuss erwiesen haben. Denn das Basisrezept der künstlichen Intelligenz zeigt bei solchen alltäglichen Problemen seine Grenzen: Normalerweise behan-delt eine "intelligente" Maschine Objekte, mit denen sie um- gehen soll, als abstrakte Symbole mit zugeordneten Eigen- schaften: Ein Sack etwa hat ein bestimmtes Gewicht und eine bestimmte Farbe.

Jede Manipulation von Objekten läuft nach logischen Regeln ab und wird von der Maschine zunächst theoretisch durchgespielt: Will die Maschine beispielsweise den Sack greifen und hochheben, folgert die Software daraus, dass die Koordinaten des Sacks sich nach dem Hochheben verändert haben müssen. Doch was in sterilen, sauber definierten Laborumgebungen funktioniert, klappt draußen noch lange nicht. Die Maschine muss mit schwankenden Lichtverhältnissen zurechtkommen, mit Menschen, die ihr in die Bahn laufen, mit Temperaturunterschieden oder störenden elektromagnetischen Feldern. Und es gibt keine Möglichkeit, ihr vorab zu vermitteln, welche dieser Daten wichtig sind und welche weniger, denn das kann sich während der Aufgabe ändern. Je komplexer aber das Modell der Umgebung ist, das der Roboter berücksichtigen soll, desto mehr Objekte und ihre Eigenschaften muss die Maschine mit einbeziehen. Immer mehr Fakten also, die über logische Regeln miteinander verknüpft sind. Der Programmieraufwand steigt dabei exponentiell.

Paradoxerweise ist eine mögliche Lösung dieses Problems die bewusste Einbeziehung eigentlich redundanter Informationen, etwa die gleichzeitige Auswertung von Bildern und Tastinformationen. "Multimodal" nennen das die KI-Forscher. Der scheinbare Informationsüberschuss soll dem Verständnis der Maschine auf die Sprünge helfen: Die Pixel-Information der Kamera wird mit den Daten der Tastsensoren gemischt – so könnte der Roboter beispielsweise lernen, dass Punkte, die aus einer bestimmten Kameraperspektive nicht sichtbar sind, ebenfalls zu einem Objekt gehören. Das zweidimensionale Pixelbild soll so "einen semantischen Sinn" bekommen; Hand und Auge würden zur "taktilen Kamera".