Software, die vom Nutzer lernt
Forscher aus 25 Organisationen machen mit: Das großangelegte KI-Projekt "CALO" soll das maschinelle Lernen revolutionieren.
- Erica Naone
Das Hauptproblem bei der Benutzung von Computern, meint Pedro Domingos, Dozent für Informatik an der University of Washington, sei vor allem, dass man ihnen jedes noch so kleine Detail von dem erklären müsse, was sie zu tun hätten: "Das nervt wirklich", scherzt der Forscher, "die sind wirklich dumm."
Deshalb nimmt Domingos auch an CALO teil, einem auf vier Jahre ausgelegten Großprojekt in der künstlichen Intelligenz (KI), das den Rechnern helfen soll, die Absichten ihrer menschlichen Nutzer besser zu versehen. Von der Militärforschungsbehörde DARPA finanziert und von der weltbekannten Stanford-Ausgründung SRI International koordiniert, arbeiten bei dem Vorhaben Forscher aus insgesamt 25 Universitäten und Firmen mit. Sie kommen aus vielen Bereichen der KI – darunter etwa das maschinelles Lernen, die Verarbeitung natürlicher Sprache und das semantische Web. Jede der Gruppen arbeitet an einem CALO-Teilbereich. Der Name steht für "Cognitive Assistant that Learns and Organizes" – ein kognitiver Assistent, der lernt und organisiert.
Adam Cheyer, Programmdirektor des KI-Zentrums am SRI, erläutert, dass CALO die Nutzer auf drei verschiedene Arten unterstützen soll: Es soll helfen, Daten über wichtige Personen und Projekte zu managen, Informationen aus menschlichen Treffen verstehen sowie Routineaufgaben erlernen und automatisieren zu können. Beispielsweise kann CALO aus E-Mail-Mustern ableiten, welche Menschen und Projekte wichtig für das Arbeitsleben des Nutzers sind. Es kann diese Informationen dann kategorisieren und nach Wichtigkeit sortieren – basierend auf der Quelle der Daten und der Projekte, mit denen sie zu tun haben. Das System kann dieses Wissen außerdem bei Meetings anwenden – mit einem Spracherkennungssystem, das eine Mitschrift von dem erzeugt, was gesagt wurde. Diese Informationen können dann anhand der Projekte und Kontakte des Nutzers intelligent verarbeitet sowie in Aufgabenlisten und Termine überführt werden. Schließlich kann man CALO auch noch Routineaufgaben beibringen, etwa den Einkauf von Büchern im Web oder die Suche nach Hotels mit bestimmten Kriterien. Das System kann außerdem von sich aus mit anderen Personen interagieren – etwa bei der Organisation von Terminen inklusive Abgleich mit den Kalendern der Teilnehmer. Die Technik soll außerdem ein Entscheidungsmodul enthalten: Sie kann dann ein Meeting beispielsweise auch verschieben, wenn eine zentrale Person keine Zeit hat.
"Das ist ein erstaunlich großes Vorhaben und in seiner Ambitioniertheit fast schon verrückt", sagt der Projektbeteiligte Domingos. Sollte CALO ein Erfolg werden, sei dies aber nicht weniger als eine Revolution: "Und sogar falls es danebengeht, erleben wir hier so viel gute Forschung, dass es sich dann trotzdem gelohnt hat."
Das Hauptziel ist der Aufbau einer Software mit künstlicher Intelligenz, die ganz praktisch als persönlicher Assistent eines modernen Büroarbeiters dienen kann – und das ohne eine feste Struktur wie beispielsweise die Hilfsagenten in Microsoft Office. Es ist ein System, das aus der Umwelt des Nutzers und seinen Bedürfnissen lernen kann und ihnen sich anpasst, ohne von den Ingenieuren umprogrammiert werden zu müssen. "Der große Unterschied zu allem, was vorher gemacht wurde, ist dieser integrierte Ansatz, der all diese Technologien und Fähigkeiten in ein einzelnes System holt", sagt SRI-Mann Cheyer. Es brauche ein System dieser Größe, um die zahlreichen Informationen zu verstehen und zu organisieren, die auf die Nutzer einstürmten.
Das Projekt verfolgt breite Ziele, doch die Forscher glauben, dass es davon profitieren kann, dass mehrere Technologien verzahnt werden. Das lässt sich etwa am Beispiel der Meetingsoftware erläutern, die Treffen protokollieren kann. Auch die besten Spracherkennungssysteme erreichten ohne Hilfe des Benutzers nur verbesserungswürdige Ergebnisse, sagt William Mark, Vizepräsident der Informatik-Abteilung am SRI. "In unserem Kontext hat CALO dank des Informationsmanagements tiefe und reiche Kenntnisse darüber, was das konkret für Personen im Raum sind und welche Dokumente, Formulierungen und Fachbegriffe sie verwenden."
Weil CALO so viele Lernsysteme enthält, liegt eine Herausforderung in der Integration der Daten, damit die Technik eine konsistente Informationsstruktur schafft, auf deren Basis Entscheidungen auch aus eher wagen Daten getroffen werden können, die aus den verschiedensten Interaktionen stammen. Domingos und seine Kollegen arbeiten daher an einem Algorithmus, der die beiden traditionellen Ansätze der KI vereint: Logik und Wahrscheinlichkeit.
Alan Qi, Juniorprofessor für Informatik an der Purdue University, der CALO bislang nur von außen kennt, hält diese Vereinigung für eines der wichtigsten Ziele der aktuellen Forschung. Denn: Eine Kombination der beiden Ansätze sei viel besser als die Nutzung eines einzelnen. Wahrscheinlichkeitstheoretische Ansätze könnten mit "Rauschen" und Unsicherheit gut umgehen, während die logische Struktur bei der Extraktion ihrer genauen Bedeutung eine Rolle spiele.
Obwohl der CALO-Ansatz sehr breit ist, hat das SRI eine Version namens CALO Express entwickelt, die einige der Funktionen des Systems in einer abgespeckten Variante enthält. Sie kann in Office-Produkte wie Outlook und PowerPoint integriert werden. Cheyer zufolge werden hier Teile der drei Hauptfunktionen eingesetzt – darunter Informationsmanagement, Hilfe bei Meetings und die Aufgabenverwaltung. CALO Express wird derzeit für den Einsatz bei der DARPA selbst erwogen. Noch ist aber unklar, ob daraus ein kommerzielles Produkt außerhalb des Militärs wird.
Technologien dieser Art dürften aber auch normale Nutzen eines Tages erreichen. Die Forschung hat bereits erste Produkte vorgelegt, etwa "Smart Desktop", ein Informationsmanager, der aus einem Projekt an der Oregon State University im Rahmen von CALO entstand. Radar Networks, Hersteller der Software Twine für das semantische Web, arbeitete ebenfalls an dem Großprojekt mit. (bsc)