Googles Developer-Chefin über Gemma, Gemini und ihre Lieblings-KI-Tools

"Nicht jeder wird dank KI auch programmieren können": Jeanine Banks, VP und General Manager für Entwickler bei Google, im Interview mit heise online.

In Pocket speichern vorlesen Druckansicht

Jeanine Banks bei der Google I/O Connect in Berlin.

(Bild: emw)

Lesezeit: 11 Min.

Jeanine Banks ist Vice President und General Manager für Developer X und Head of Developer Relations bei Google. Sie hielt die Entwickler-Keynote auf der Google I/O in Mountain View, Kalifornien, im Mai 2024. Und auf der Google I/O Connect in Berlin kündigte sie auf der Bühne den Launch von Gemma 2 an. heise online sprach mit Banks über die Zukunft von KI, wie KI Entwicklern helfen kann und wo es Grenzen gibt.

Seit dem Start von ChatGPT ist KI in aller Munde. Sie sind aber schon viel länger im Bereich der KI tätig. Was hat sich für Sie geändert, seit es diesen großen Hype gibt?

Das ist wahr. Wissen Sie, Google ist seit 2016 ein AI-first Unternehmen, also ist es in gewisser Weise nicht neu für uns. Wir entwickeln schon seit einigen Jahren Modelle und Tools und stellen sie den Entwicklern zur Verfügung. Wenn Sie an das ursprüngliche Transformers-Papier denken, das die Grundlage für die Large Language Models bildet, die heute verfügbar sind – das ist von Google. Außerdem haben wir ganze Systeme für maschinelles Lernen aufgebaut, darunter das führende TensorFlow-Framework, das JAX-Framework und die TPU-Infrastruktur, die die beste Leistung und Skalierbarkeit für maschinelle Lernaufgaben bieten. Es ist also wirklich schön zu sehen, dass die Art und Weise, wie wir uns für die Weiterentwicklung des Feldes eingesetzt haben, über diese Bemühungen hinaus wächst und sich immer weiter durchsetzt.

Und seither haben wir KI in unsere Produkte integriert. Wir haben KI in die Google-Suche integriert, mit der Search Generative Experience, in das Pixel mit erstaunlichen Funktionen und in das Android-Betriebssystem mit etwa AI Core. Wir werden KI weiter vorantreiben, und einige der Ankündigungen, die wir bei Google gemacht haben, einschließlich unseres Vortrags hier auf der I/O Connect Berlin, zeigen, wie wir KI in unsere Tools und Plattformen von Google Cloud, Vertex AI und Firebase integriert haben. Aber wir sind noch immer am Anfang der Entwicklung.

Wir gehen davon aus, dass es viele neue Ideen geben wird, auf die Entwickler stoßen können. Deshalb ist es so wichtig, dass wir in die Zugänglichkeit investieren und die leistungsfähigsten KI-Modelle bereitstellen, sei es über APIs wie die Gemini API oder offen verfügbare Modelle wie unsere Gemma-Familie. Damit können Entwickler die neueste Technologie nutzen und haben die größte Auswahl, um ihre Ideen und Anwendungen umzusetzen.

Google geht beide Wege: Können Sie mir den Unterschied zwischen den Modellen Gemini und Gemma erklären?

Wir sprechen gerne von der Gemini-Ära. Damit wollen wir zum Ausdruck bringen, dass wir die Gemini-Familie eingeführt haben, die unser leistungsfähigstes KI-Modell ist. Als wir Gemini eingeführt haben, hatten wir Nano, unser kleineres Modell, das für On-Device-Anwendungen optimiert ist. Gemini Pro ist unser kosteneffizientestes Leistungsmodell für eine größere Vielfalt, eine breitere Palette von Anwendungen. Und dann haben wir mit Ultra auch unsere fortschrittlicheren Modelle eingeführt. Seitdem haben wir unsere Modellfamilie erweitert.

Mit der Verfügbarkeit von Gemini 1.5 Pro und 1.5 Flash gibt es auch hier auf der I/O Connect Berlin einige großartige Neuigkeiten. Diese Modelle setzen weiterhin neue Maßstäbe in Bezug auf Kosteneffizienz, geringere Latenzzeiten und sind von Grund auf multimodal. Wir glauben, dass dies den Entwicklern die Möglichkeit gibt, noch interessantere und differenziertere Arten von Anwendungen zu entwickeln.

Auf der anderen Seite sind unsere offenen Modelle von Gemma so konzipiert, dass Entwickler die Flexibilität haben, die Modelle auf ihre eigenen Daten und ihre spezifischen Anwendungsfälle abzustimmen, während sie die Flexibilität und die Wahl haben, diese Modelle dort einzusetzen, wo sie es für richtig halten. Sie sind speziell für kleinere Größen konzipiert, so dass wir ursprünglich das 2B-Modell eingeführt haben und jetzt in der Lage sind, größere Modelle einzuführen.

Glauben Sie, dass in ein paar Jahren alle Menschen programmieren können werden? Oder nur noch ein paar Leute? Und wird es das Internet so verändern, wie wir es jetzt sehen?

Ich liebe diese Frage. Denn das ist etwas, worüber ich oft nachdenke. Wird jeder in der Lage sein zu programmieren? Ich denke da an Leute wie meine Mutter. Da bezweifle ich es. Aber im Allgemeinen glaube ich, dass wir mindestens zwei Trends sehen werden. Professionelle Entwickler, die programmieren können, sind plötzlich sehr viel produktiver, weil sie jetzt KI in ihrem Arbeitsablauf einsetzen können, um Aufgaben zu erledigen, die nicht gerade der angenehmste Teil ihrer Arbeit sind und die sich manchmal ziemlich wiederholen, wie zum Beispiel das Schreiben von Unit-Tests oder das Schreiben von bestimmten Standardtexten in der Codebasis. Stimmt's? Genitive AI übernimmt das.

Um sich als Entwickler auf komplexere Aufgaben konzentrieren zu können, Aufgaben, die kreatives Denken und Problemlösung erfordern, Architektur, Designfragen, Entwicklung meiner Codebasis und des Systems, wird es weiter Fähigkeiten im Programmieren brauchen. Entwickler werden weiterhin programmieren. Das ist also der erste Trend.

Der zweite Trend ist, dass wir glauben, dass die Einstiegshürde für Menschen, die programmieren und Software entwickeln wollen, sinken wird. Ich weiß nicht, in welchem Zeitrahmen das geschehen wird, aber wir sehen bereits Anzeichen dafür, dass neuere Entwickler in der Lage sind, sich viel effektiver und schneller in ihre Rolle einzufinden, weil sie Unterstützung und Hilfe bekommen. Interessant ist auch, dass KI nicht nur Code schreibt. Es gibt noch andere Dinge, die sie tun kann, um jungen Entwicklern zu helfen, sich zu verbessern und mit der Zeit bessere Entwickler zu werden. Zum Beispiel kann man die KI bitten, Code zu erklären. Wenn ich also ein Entwickler bin, der in ein Team einsteigt und der eine Codebasis vor sich hat, die er noch nie zuvor gesehen hat, kann er Gemini bitten, den Code zu erklären, damit lernt er, was von anderen Entwicklern im Team geschrieben wurde. Früher musste man wochenlang lesen und die Codebasis studieren, und trotzdem war es schwer, einen Beitrag zu leisten und produktiv zu sein.

Wir glauben also, dass mehr Leute künftig effizienter programmieren können, und wir freuen uns darauf.

Und glauben Sie, dass sich das Internet dadurch verändern wird? Wenn es vielleicht mehr Webseiten gibt, weil es leichter wird, eine zu bauen?

Nun, wissen Sie, selbst heute, wenn wir an das letzte Jahrzehnt denken, gibt es Millionen von Webseiten. Deshalb glauben wir, dass die Aufgabe von Google jetzt noch dringender und notwendiger ist als je zuvor. Es geht darum, die Informationen der Welt zu organisieren und sie universell zugänglich und nützlich zu machen. Und wir glauben, dass dies nach wie vor unerlässlich ist und dass wir dabei helfen können, die Informationen im Internet zu organisieren, damit die Menschen weiterhin das finden können, was sie brauchen, um weiterhin forschen und lernen und lesen zu können und ihr Leben mit Hilfe des Internets gestalten zu können.

Was ich noch erwähnen möchte, ist, dass ich persönlich zu einer Webentwicklerin wurde, als die HTML 4.1-Spezifikation für Kommentare kam. Es war noch nicht einmal ein veröffentlichter Standard. Durch ein Praktikum beim Book Haven National Laboratory in Upton, New York, hatte ich die Möglichkeit, mit Computerservern zu arbeiten, HTML zu lernen und zu üben. Ich bekam den Zugang und die Möglichkeit – und so sind Entwickler immer noch in der Lage, etwas zu entwickeln und einen sinnvollen Beitrag zum Internet zu leisten. Ich denke also, dass Googles Aufgabe darin besteht, dafür zu sorgen, dass Entwickler weiterhin die Werkzeuge bekommen, die sie brauchen, um tolle Webinhalte und Anwendungen zu erstellen, die im Internet auffindbar sind.

Google I/O Connect in Berlin.

(Bild: emw)

Das tun wir zum Beispiel mit den neuesten Weiterentwicklungen, die wir im Chrome-Browser eingeführt haben, Chrome DevTools Console Insights, die über Gemini laufen. Als Entwickler können Sie mit Hilfe von Gemini ganz einfach Probleme oder Fehler in Ihrer Website identifizieren, die dazu führen, dass sie nicht richtig geladen wird, nicht gut angezeigt wird oder einfach nicht gut funktioniert, und diese Probleme lassen sich dann auch sehr schnell lösen. So können Sie letztendlich eine sehr hohe Qualität der Webinhalte und des Webzugangs erreichen. Wir sind der Meinung, dass solche Möglichkeiten Entwickler in die Lage versetzen, ein gesundes Internet mit mehr Inhalten zu schaffen.

Gibt es für den Einsatz von KI auch Grenzen?

Auf der diesjährigen Google I/O hat unser CEO Sundar Pichai etwas gesagt, das ich persönlich als ziemlich tiefgründig empfunden habe, obwohl es eine recht einfache Idee war: KI soll für alle Menschen hilfreich sein. Das ist für uns eine Art Leitgedanke, um darüber nachzudenken, wie die Menschen diese Technologie sinnvoll nutzen können. Und eine der wichtigsten Maßnahmen, die wir ergriffen haben, ist die Integration in die Produkte von Google. Nach dem, was ich von Unternehmen höre, mit denen ich spreche, egal aus welcher Branchen, vom Bankwesen über das Gesundheitswesen bis hin zum Einzelhandel, finden sie alle wirklich interessante Wege, diese Technologie anzuwenden. Anwendungsfälle, die ihnen helfen, einen großen Nutzen für ihr Geschäft zu erzielen. Ein großes Versicherungsunternehmen beispielsweise, das die Gemini-API in seine Anwendung auf Google Cloud implementiert hat, konnte etwa die Latenzzeit für seine Kundendienstmitarbeiter erheblich reduzieren, da sie nun von einem Chatbot unterstützt werden. Wenn man diese Art von Anwendungen sieht, finde ich wirklich vielversprechend, was möglich ist.

Was ist Ihr Lieblings-KI-Moment oder was verwenden Sie täglich?

Ich mache sehr viele Fotos. Ich bin gerade von einer Reise nach Japan zurückgekommen. Ich bin mit meinem Mann und einem meiner Söhne, unserem jüngsten Sohn, gereist. Es war ein Riesenspaß. Wir haben so viele tolle Fotos gemacht. Und Google Fotos ist einfach super praktisch. Ich verwende es sehr regelmäßig, um meine Fotos zu organisieren und Fotoalben zu erstellen. Ich finde es toll, wenn es mir Vorschläge macht, auch wenn ich Google Fotos gerade gar nicht anschaue oder die App geöffnet habe: Erinnerungen oder eine Fotocollage von einem bestimmten Zeitpunkt in der Vergangenheit, und die Momente mir sozusagen wieder ins Gedächtnis gerufen werden. Das finde ich immer sehr schön.

(emw)