What The Diff: Code-Assistent liest Pull Requests und verfasst Textbeschreibung
Mit KI-Unterstützung analysiert das neue Tool Pull Requests bei GitHub und fasst die Änderungen automatisch in Textform zusammen. Das Training bot OpenAI Codex.
(Bild: Phonlamai Photo/Shutterstock.com)
- Silke Hahn
Das deutsche Start-up Beyond Code hat einen neuen Code-Review-Assistenten veröffentlicht, der KI-gestützt Pull Requests (PR) bei GitHub einliest und einen Plaintext zu den vorgenommenen Änderungen erstellt. Das von Beyond Code eingesetzte Werkzeug ist mithilfe des KI-Systems Codex von OpenAI mit Millionen Codezeilen trainiert. "What The Diff" kann Pull Requests automatisiert kommentieren.
Das Review-Tool analysiert laut Beschreibung ausschließlich die Differenzen (Diff), und davon ausgehend beschreibt es, welche Änderungen stattgefunden haben. Laut den Gründern Sebastian Schlein und Marcel Pociot kommen hierbei auch Änderungen zutage, die man als Entwickler nicht geplant oder erwartet hatte. Die Zusammenfassung erstellt das Tool in englischer Sprache.
KI-generierte Changelogs: technischer Ablauf
GitHub versendet beim Erstellen eines Pull Requests einen Webhook. Das Tool verbindet sich über die GitHub-API mit dem gewünschten Repository und liest die Diff-Datei des Pull Requests ein, dabei filtert es überflüssige Informationen wie CSS- oder JS-Dateien aus. Die gefilterte Diff setzt das Tool binnen Sekunden in eine lesbare Zusammenfassung um und stellt sie als Kommentar in den Pull Request ein.
Videos by heise
What The Diff soll mit nahezu allen Programmiersprachen zurechtkommen (mit welchen das nicht der Fall ist, geht aus der Projektbeschreibung nicht hervor), die Beschreibung gibt das Tool stets auf Englisch aus. Proprietärer Code soll laut Anbieter dabei sicher sein, da beim Analyiseren der Änderungen der Code weder angetastet noch abgespeichert wird, und der Projektcode wird folglich nicht zum weiteren Training der KI genutzt.
Dass das Tool Zugriff zum Code benötigt, liegt an den technischen Gegebenheiten von GitHub: Zurzeit gibt es noch keinen Read-only-Diff-Zugriff. Um die Änderungen lesen zu können, ist Codezugriff erforderlich. Um den Tokenverbrauch beim Nutzen des Tools zu reduzieren, lässt sich die eigene Konfiguration auch feinabstimmen: So empfehlen die Beyond-Code-Gründer, eher mit kleineren Pull Requests zu arbeiten und Drafts auszuschließen. Entwürfe, die noch nicht fertig sind für die Review, lassen sich beispielsweise mit "WIP" (Work in Progress) labeln, oder man kann das Tool anweisen, nur als "WTD" (What The Difference) gelabelte Requests zu berücksichtigen. Mehr dazu ist einem Blogbeitrag von Sebastian Schlein zu entnehmen, einem der Gründer von Beyond Code.
Das Code-Review-Tool testen
Zum Set-up loggt man sich auf der What-The-Diff-Website mit dem eigenen GitHub-Konto ein, konfiguriert die App und erteilt Zugriff zu einem oder mehreren Repositories. Das Tool lässt sich dann auf den gewünschten Repositories aktivieren. Wer das Tool nutzen möchte, kann es kostenlos ausprobieren. Das kostenlose Angebot umfasst bis zu 25.000 Token pro Monat, was ungefähr fünf bis zehn mittelgroßen Pull Requests entspricht. Die Anzahl der Repositories ist dabei nicht beschränkt. Wer einen größeren Bedarf hat oder professionellen Support wünscht, kann zwischen vier kostenpflichtigen Abos zwischen 200.000 und vier Millionen Token pro Monat wählen.
Die Anbieter empfehlen, zunächst mit der kostenlosen Variante eine Testphase zu beginnen, um zu prüfen, ob die Funktionsweise den eigenen Bedürfnissen entspricht – das Tool befindet sich noch in der Betaphase. Weitere Informationen und Beispiele lassen sich der Projektwebsite entnehmen.
In der ersten Version stand, die beiden Gründer hätten das Tool selbst trainiert und mit GPT-3 kombiniert. Tatsächlich nutzten sie Codex von OpenAI zum Training. Anriss und Text sind entsprechend angepasst.
(sih)