Erklär-KI: Aleph Alpha stellt neue Generation vertrauenswürdiger KI-Modelle vor

Erklärbarkeit und Vertrauenswürdigkeit gelten als Schwachstellen großer Sprachmodelle. Aleph Alphas KI-System soll mit neuer Controlversion Abhilfe schaffen.

In Pocket speichern vorlesen Druckansicht 4 Kommentare lesen
Server,Racks,In,Server,Room,Data,Center.,3d,Render

(Bild: Sashkin/Shutterstock.com)

Lesezeit: 6 Min.
Von
  • Silke Hahn
Inhaltsverzeichnis

(This article also exists in English.)

Das Heidelberger KI-Unternehmen Aleph Alpha hat eine neue Generation seiner KI-Modelle vorgestellt. Zur bisherigen Luminous-Familie, die aus drei unterschiedlich großen Foundation Models besteht, existiert ab sofort eine Control-Version. Technisch handelt es sich laut Auskunft des Anbieters um Instruct-Modelle, die in einem ähnlichen Verfahren wie bei OpenAI und deren InstructGPT für das Verarbeiten natürlicher Sprache und das Lösen komplexer Aufgaben der Computerlinguistik nachjustiert worden seien, im Falle von Aleph Alpha in einem automatisierten Verfahren ohne menschliches Feedback.

Neu ist gemäß Ankündigung bei der jetzt vorgestellten Modellgeneration die Erklärbarkeit und Reproduzierbarkeit des Outputs. Laut Firmengründer und Geschäftsführer Jonas Andrulis sei Aleph Alpha mit den Control-Modellen "die einzige Option am Markt, die Aufgaben mit Erklärbarkeit, Reproduzierbarkeit und Vertrauen löst". Hierzu hatte Aleph Alpha im Frühjahr 2023 gemeinsam mit akademischen Partnern Forschungsbeiträge veröffentlicht, etwa im Januar Attention Manipulation (AtMan) in Kooperation mit dem DFKI und der TU Darmstadt sowie Ende Mai in Kooperation mit Stability AI und Carper AI eine neue Methode zum Einhegen des Verteilungsbias in großen Sprachmodellen (Quality through Diversity in AI Feedback).

Die gewonnenen Forschungserkenntnisse werden den Heidelbergern zufolge sukzessive in die Modelle eingearbeitet und sollen deren Output nachvollziehbar machen. Im April etwa baute Aleph Alpha mit AtMan Explain eine Faktenprüfung in seine Modelle ein, die die Ergebnisse mit Quellenangaben nachvollziehbar machen soll. Dabei kann die Herkunft von faktischen Ausgaben auf Quellen in Texten und Bildern zurückgeführt werden, bis hin zu kontrafaktischen, also widersprüchlichen Beobachtungen in Daten.

Die implementierten Funktionen seien Schritte in Richtung der kommenden regulatorischen Anforderungen: Der kommende AI Act wird nach jetzigem Stand des Entwurfs klare Anforderungen an die Erklärbarkeit und Rückverfolgbarkeit der Angaben generativer KI stellen. Offenbar setzt Aleph Alpha als Anbieter generativer und Allzweck-KI (General Purpose AI) sich intensiv mit der bevorstehenden Regulierung auseinander und richtet seine KI-Systeme entsprechend aus.

Die bisherigen drei Modellversionen sind für die kontrollierte Modellgeneration auf das Ausführen von Befehlen und Anweisungen (Instructions) hin feingetuned worden, wie Pressesprecher Tim-André Thomas auf Nachfrage erklärt. Dafür habe die Forschungsabteilung von Aleph Alpha neue Datensätze gesammelt und in einem überwachten Finetuning den Output des Modells stärker auf den Input ausgerichtet (aligned), somit die Ergebnisse näher an die Eingabeprompts und Anweisungen herangeführt.

Die neue Modellgeneration solle die bestehenden Basismodelle nicht ablösen, sondern ergänzen. Wer bereits über API oder Playground mit den bisherigen Foundation Models arbeite, könne dies weiterhin tun. Die neuen Modelle sollen sich einfacher nutzen lassen, da sie im Zero-Shot Prompting ansprechbar sind, also weniger Kontext zum Ausführen von Aufgaben benötigen. Zuvor war es offenbar nötig, im Few-Shot Prompting dem Modell mehr Hinweise oder Beispiele zu zeigen, um die gewünschten Ergebnisse wie eine Zusammenfassung, Antworten auf Fragen oder eine Bildbeschreibung im kombinierten multimodalen Prompten zu erhalten.

Die Control-Modelle sollen mit einer einzelnen Anweisung das gewünschte Ergebnis liefern, wie Nutzer es mittlerweile von Systemen wie ChatGPT kennen und auch gewohnt sind, und sollen wie bisher fünf Sprachen beherrschen (neben Deutsch und Englisch wurden die Grundmodelle auch auf Französisch, Italienisch und Spanisch trainiert). Dem Anbieter zufolge ermöglichen die neuen Modelle einen strafferen Entwicklungszyklus von KI-Chatbots und digitalen Assistenten, deren Erstellung wohl zum Kernangebot von Aleph Alpha für dessen Kunden und Partner gehört.

Laut Andrulis habe seine Technologie insbesondere Unternehmen im Rechts-, Gesundheits- und Bankenwesen im Blick sowie in der öffentlichen Verwaltung – Aleph Alpha ist auf Unternehmenskunden und öffentliche Einrichtungen spezialisiert, arbeitet etwa mit dem Cyberhub der Bundeswehr, einem Bundesministerium, der Stadt Heidelberg und dem Land Baden-Württemberg zusammen. Der Innovationsatlas der deutschen Regionen hat dieses Bundesland gerade zum "innovativsten" unter den 16 deutschen Bundesländern gekürt, so Finanzminister Danyal Bayaz auf Twitter. Andrulis erwähnte Pilotkundenprojekte, in denen vor der Markteinführung Evaluierungen stattfanden. Demzufolge seien die Control-Modelle in der Lage, treffsicherere Antworten zu liefern als zuvor. Benchmarks liegen jedoch nicht vor. Die Pilotkunden wurden "aus Gründen der Vertraulichkeit" nicht genannt.

Der KI-Forscher Jonas Andrulis im eigenen Rechenzentrum: Andrulis leitet das von ihm gegründete, in Heidelberg ansässige Unternehmen Aleph Alpha. Mit seinem Team erhielt er 2021 den Deutschen KI-Preis – für eine Technologie vergleichbar mit OpenAI und Google DeepMind. Vorher hatte der Wirtschaftsingenieur geheime KI-Projekte bei Apple in Kalifornien geleitet (Special Projects Group) und das Sprachsystem Siri weiterentwickelt.

(Bild: © Manuel Schlüter)

An Partnern sind etwa die IT-Beratungshäuser ONTEC, adesso, die msg Group und das französische Beratungshaus Sopra Steria bekannt. Offenbar bahnt sich auch eine Partnerschaft mit SAP an, wie im Vorfeld der SAPPHIRE in WELT und im Handelsblatt zu lesen war. SAP soll in der laufenden Finanzierungsrunde des Start-ups mit einem dreistelligen Millionenbetrag einsteigen. Eine offizielle Ankündigung seitens SAP oder Aleph Alpha liegt bislang nicht vor – vermutlich, da die Finanzierungsrunde noch nicht abgeschlossen ist.

Allerdings war Heise-Redakteuren bei der virtuellen Ausgabe der SAPPHIRE in Orlando in der Präsentation des SAP-CEO Christian Klein das Aleph-Alpha-Logo aufgefallen. Klein hatte die Heidelberger neben Microsoft, Databricks und weiteren möglichen KI-Partnern in einer Keynote erwähnt. Im Pressebriefing nannte er auf Nachfrage zwar keinen der Pilotpartner namentlich, erwähnte aber eine Reihe von Projekten zu KI-Anwendungen, an denen nun intern mit Partnern gearbeitet werde.

Der Forschungsbericht zu "Quality Diversity through AI Feedback" lässt sich bei Carper AI (lang) und bei Aleph Alpha (gestrafft) jeweils im Blog nachlesen. Die drei neuen Modelltypen der Control-Generation stehen ab sofort im Aleph-Alpha-Playground allen Nutzern zur Verfügung. Der Spielplatz lässt sich mit einem Freiguthaben als Demo testen.

(sih)