KI: Devin befördert KI-Assistenten vom Codeschreiber zum Software-Engineer
Das Start-up Cognition stellt den KI-Agenten Devin vor, der anhand weniger Instruktionen Softwareprojekte umsetzen und GitHub-Issues auflösen soll.
Mit Devin ist ein KI-Agent erschienen, der selbsttätig komplexe Software-Engineering-Aufgaben angeht. Im Gegensatz zu KI-gestützten Codeassistenten wie GitHub Copilot ist er nicht darauf beschränkt, einfache Codeblöcke zu schreiben, sondern darauf ausgelegt, vollständige Projekte umzusetzen. Außerdem schlägt sich der Agent wohl gut im Benchmark SWE-bench.
Cognition, das Start-up hinter dem Projekt, hat allerdings bisher wenig an technischen Informationen zu Devin veröffentlicht. In dem Blog findet sich lediglich ein Beitrag, der das System kurz beschreibt und einige Beispielvideos zeigt.
Derzeit steht der KI-Agent nicht öffentlich zur Verfügung, sondern befindet sich in einer privaten Betaphase. Ob die Videos tatsächlich die Arbeitsweise wiedergeben und wie viel menschliche Unterstützung erforderlich ist, ist zum jetzigen Zeitpunkt nicht erkennbar.
Laut der Website des Unternehmens hat das Start-up eine 21 Millionen US-Dollar in einer ersten Finanzierungsrunde erhalten.
Game of Life, Fehlerkorrektur und versteckte Nachrichten
Einige YouTube-Videos sollen die Möglichkeiten des KI-Agenten zeigen. Die auf ein bis drei Minuten zusammengeschnittenen Clips zeigen jeweils nur kurze Ausschnitte der Arbeitsweise, bei der Devin unter anderem im Browser selbsttätig recherchiert und die Kommandozeile verwendet.
Die menschlichen Instruktionen beschränken sich in den Videos darauf, die grundsätzliche Aufgabe zu beschreiben und Quellen anzugeben. Devin sucht wohl auch selbsttätig nach zusätzlichen Informationen und konsultiert beispielsweise in einem Video die Rust-Dokumentation.
Empfohlener redaktioneller Inhalt
Mit Ihrer Zustimmmung wird hier ein externes YouTube-Video (Google Ireland Limited) geladen.
Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Google Ireland Limited) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.
Ein Beispiel erstellt eine Website mit Conways Spiel des Lebens, das Devin mit React umsetzt und über Netlify veröffentlicht. In einem anderen Clip lernt der Agent, wie man versteckte Nachrichten in Bildern unterbringt. Weitere Anwendungsfälle widmen sich dem Feintuning großer Sprachmodelle (Large Language Models, LLMs), dem Erfüllen von Feature Requests und dem automatischen Beheben von Bugs in Projekten.
Finde den Fehler! Löse das Problem!
Ein Fokus von Devin liegt darauf, Fehler zu finden und Issues zu behandeln. Ein Video zeigt, wie das System Fehler in einem Projekt findet und behebt, ein anderes erstellt Code, um GitHub-Issues aufzulösen.
Laut dem Blogbeitrag zur Vorstellung des KI-Systems kann Devin knapp 14 Prozent der Problemstellungen im SWE-bench lösen. Der Benchmark misst, wie gut LLMs sich bei real existierenden GitHub-Issues schlagen.
Wer an der geschlossenen Testphase teilnehmen möchte, kann sich mit einem Webformular bewerben.
(rme)