KI: Devin befördert KI-Assistenten vom Codeschreiber zum Software-Engineer

Das Start-up Cognition stellt den KI-Agenten Devin vor, der anhand weniger Instruktionen Softwareprojekte umsetzen und GitHub-Issues auflösen soll.

In Pocket speichern vorlesen Druckansicht 92 Kommentare lesen
Zwei Roboterhände auf einer ergonomischen Tastatur

(Bild: maxuser/Shutterstock.com)

Lesezeit: 2 Min.

Mit Devin ist ein KI-Agent erschienen, der selbsttätig komplexe Software-Engineering-Aufgaben angeht. Im Gegensatz zu KI-gestützten Codeassistenten wie GitHub Copilot ist er nicht darauf beschränkt, einfache Codeblöcke zu schreiben, sondern darauf ausgelegt, vollständige Projekte umzusetzen. Außerdem schlägt sich der Agent wohl gut im Benchmark SWE-bench.

Cognition, das Start-up hinter dem Projekt, hat allerdings bisher wenig an technischen Informationen zu Devin veröffentlicht. In dem Blog findet sich lediglich ein Beitrag, der das System kurz beschreibt und einige Beispielvideos zeigt.

Derzeit steht der KI-Agent nicht öffentlich zur Verfügung, sondern befindet sich in einer privaten Betaphase. Ob die Videos tatsächlich die Arbeitsweise wiedergeben und wie viel menschliche Unterstützung erforderlich ist, ist zum jetzigen Zeitpunkt nicht erkennbar.

Laut der Website des Unternehmens hat das Start-up eine 21 Millionen US-Dollar in einer ersten Finanzierungsrunde erhalten.

Einige YouTube-Videos sollen die Möglichkeiten des KI-Agenten zeigen. Die auf ein bis drei Minuten zusammengeschnittenen Clips zeigen jeweils nur kurze Ausschnitte der Arbeitsweise, bei der Devin unter anderem im Browser selbsttätig recherchiert und die Kommandozeile verwendet.

Die menschlichen Instruktionen beschränken sich in den Videos darauf, die grundsätzliche Aufgabe zu beschreiben und Quellen anzugeben. Devin sucht wohl auch selbsttätig nach zusätzlichen Informationen und konsultiert beispielsweise in einem Video die Rust-Dokumentation.

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmmung wird hier ein externes YouTube-Video (Google Ireland Limited) geladen.

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Google Ireland Limited) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Ein Beispiel erstellt eine Website mit Conways Spiel des Lebens, das Devin mit React umsetzt und über Netlify veröffentlicht. In einem anderen Clip lernt der Agent, wie man versteckte Nachrichten in Bildern unterbringt. Weitere Anwendungsfälle widmen sich dem Feintuning großer Sprachmodelle (Large Language Models, LLMs), dem Erfüllen von Feature Requests und dem automatischen Beheben von Bugs in Projekten.

Ein Fokus von Devin liegt darauf, Fehler zu finden und Issues zu behandeln. Ein Video zeigt, wie das System Fehler in einem Projekt findet und behebt, ein anderes erstellt Code, um GitHub-Issues aufzulösen.

Laut dem Blogbeitrag zur Vorstellung des KI-Systems kann Devin knapp 14 Prozent der Problemstellungen im SWE-bench lösen. Der Benchmark misst, wie gut LLMs sich bei real existierenden GitHub-Issues schlagen.

Im Vergleich zu LLMs wie Llama und GPT-4 erzielt Devin deutlich bessere Ergebnisse im Benchmark SWE-bench.

(Bild: Cognition)

Wer an der geschlossenen Testphase teilnehmen möchte, kann sich mit einem Webformular bewerben.

(rme)