GPT-4 kommt nächste Woche – und es wird multimodal: Vorankündigung von Microsoft

Das Release von GPT-4 steht unmittelbar bevor, wie der CTO von Microsoft Deutschland Andreas Braun im Rahmen einer KI-Kickoff-Veranstaltung mitteilte.

64

(Bild: maxuser/Shutterstock.com)

09.03.2023, 14:36 Uhr

Lesezeit: 8 Min.

Developer

Von

Silke Hahn

(This article is also available in English.)

GPT-4 kommt nächste Woche: Bei einer rund einstündigen hybriden Informationsveranstaltung unter dem Titel "KI im Fokus – Digitaler Kickoff" stellten am 9. März 2023 vier Mitarbeiter von Microsoft Germany große Sprachmodelle als disruptive Kraft für Unternehmen und ihr Angebot Azure-OpenAI im Detail vor. Eher beiläufig erwähnte Andreas Braun, CTO Microsoft Germany und Lead Data & AI STU, das ihm zufolge unmittelbar bevorstehende Release von GPT-4. Dass Microsoft mit OpenAI an Multimodalität feilt, dürfte seit dem Release von Kosmos-1 Anfang März kein Geheimnis mehr gewesen sein.

Dr. Andreas Braun, CTO Microsoft Germany und Lead Data & AI STU beim digitalen Kickoff von Microsoft: "KI im Fokus" (Screenshot)

(Bild: Microsoft)

"Wir werden nächste Woche GPT-4 vorstellen"

"Wir werden nächste Woche GPT-4 vorstellen, da haben wir multimodale Modelle, die noch ganz andere Möglichkeiten bieten werden – zum Beispiel Videos", sagte Braun in seinem Redebeitrag zu den Anwendungsmöglichkeiten von KI und ChatGPT. Der CTO bezeichnete große Sprachmodelle als "Game Changer", da sie Maschinen beibrächten, natürliche Sprache zu verstehen. In einer statistischen Weise verstünden die Maschinen dann, was früher nur für Menschen lesbar und verstehbar war. Dabei sei die Technik mittlerweile so weit, dass das "prinzipiell in allen Sprachen" funktioniere: So könne man auf Deutsch fragen und auf Italienisch die Antwort bekommen. Mit der Multimodalität werde Microsoft(-OpenAI) die Modelle zudem "übergreifend machen".

Silke Hahn ist Technik-Redakteurin bei Heise, Redaktion iX und heise Developer. Mit ihrem historischen Hintergrund (sie studierte Alte Geschichte und tote Sprachen) schlägt sie eine Brücke zwischen Antike und Moderne. Künstliche Intelligenz und Technologie-Souveränität hält sie für das brisanteste Thema unserer Zeit und verfolgt die laufenden Debatten rund um generalisierende KI sowie um die KI-Gesetzgebung mit Aufmerksamkeit.

Videos by heise

Disruption und "alte Schätzchen"

Neben Braun war die Geschäftsführerin von Microsoft Germany, Marianne Janik, anwesend, die sich zu Disruption durch KI in den Unternehmen äußerte. Janik betonte das Wertschöpfungspotenzial Künstlicher Intelligenz und sprach von einer Zeitenwende – die aktuelle KI-Entwicklung und ChatGPT seien "ein iPhone-Moment". Es gehe nicht darum, Jobs zu ersetzen, sondern repetitive Aufgaben auf andere Weise als bisher zu erledigen. Ein Punkt, der in der öffentlichen Diskussion oft vergessen werde, sei, dass "wir in Deutschland noch sehr viel Legacy in unseren Unternehmen" hätten und "alte Schätzchen über Jahre am Leben erhalten".

Disruption gehe nicht zwingend mit Jobverlust einher. Es werde "viele Experten brauchen, um die Nutzung von KI wertschöpfend zu machen", betonte Janik. Traditionelle Berufsbilder würden sich nun ändern und es entstünden spannende neue Berufe durch die Anreicherung mit den neuen Möglichkeiten. Unternehmen empfiehlt sie, intern Kompetenzzentren zu bilden, die die Mitarbeiter im Umgang mit der KI schulen und Ideen für Projekte bündeln könnten. Dabei sei "an die Migration alter Schätzchen zu denken".

Disruption in der deutschen Industrie: Keynote von Dr. Marianne Janik, CEO Microsoft Germany bei "KI im Fokus" (Screenshot)

(Bild: Microsoft)

Daneben betonte die Geschäftsführerin, dass Microsoft die Daten der Kunden nicht nutze, um Modelle zu trainieren (was jedoch zumindest für den Forschungspartner OpenAI laut dessen ChatGPT-Policy nicht zutrifft oder -traf). Janik sprach auch von einer "Demokratisierung" – womit sie freilich nur die sofortige Nutzbarkeit der Modelle im Rahmen der Microsoft-Produktpalette meinte, insbesondere deren breite Verfügbarkeit durch die Integration von KI in der Azureplattform, in Outlook und Teams.

Lesen Sie auch

Kommentar zum AI Act: Es droht das Aus für ChatGPT in der EU

Wie OpenAI ChatGPT entwickelt hat: Ein exklusives Gespräch mit den Machern

Luminous schließt Europas KI-Lücke: Aleph Alpha auf Augenhöhe mit US-Anbietern

Anwendungsfälle, die heute schon möglich sind

Senior KI-Specialist Clemens Sieber und der Chief Technologist Business Development KI & Emerging Technologies Holger Kenn gaben Einblick in die praktische KI-Nutzung und Use Cases, an denen ihre Teams zurzeit arbeiten, teilten aber auch etwas technischen Hintergrund. Kenn erläuterte, worum es bei multimodaler KI geht, die Text nicht nur nach Bildern, sondern auch nach Musik und Video umsetzen kann, und sprach neben der Modell-Klasse GPT-3.5 von den Embeddings, die zur internen Darstellung von Texten im Modell dienen. Responsible AI sei in die Microsoft-Produkte schon eingebaut, und über die Cloud seien "Millionen von Anfragen in den APIs abbildbar". Worin ihm wohl die meisten Anwesenden zustimmten, war die Einschätzung, dass jetzt der Zeitpunkt sei, um loszulegen. Speziell im Programmierbereich ergeben sich durch die Programmiermodelle wie Codex und Copilot Arbeitserleichterungen beim Erstellen von Boilerplate-Code.

Dr. Andreas Braun, CTO Microsoft Germany, and Dr. Holger Kenn, Chief Technologist Business Development AI & Emerging Technologies, both Microsoft Germany — Dr. Holger Kenn, Chief Technologist Business Development AI & Emerging Technologies, erklärt lebhaft, wie Multimodalität funktioniert ("KI im Fokus", Screenshot)

(Bild: Microsoft)

Clemens Siebler illustrierte mit Use Cases, was bereits heute möglich ist. So ließen sich Speech-to-Text Telefonate aufzeichnen und die Agenten eines Callcenters müssten den Inhalt nicht mehr manuell zusammenfassen und eintippen. Bei einem großen Microsoftkunden in den Niederlanden, der täglich 30.000 Anrufe entgegennimmt, ließen sich so laut Siebler 500 Arbeitsstunden täglich einsparen. Den Prototyp für das Projekt habe man binnen zwei Stunden erstellt, ein einzelner Entwickler habe das Projekt in zwei Wochen umgesetzt (zuzüglich weiterer Zeit zur finalen Implementierung). Ihm zufolge seien die drei häufigsten Anwendungsfälle das Beantworten von Fragen auf Firmenwissen, das nur für Mitarbeiter zugänglich ist, die KI-unterstützte Dokumentenverarbeitung und die Semiautomatisierung durch das Verarbeiten gesprochener Sprache im Call- und Contact Center.

KI im Fokus – digitaler Kickoff von Microsoft am 9. März 2023 — "KI im Fokus – digitaler Kickoff" von Microsoft am 9. März 2023 (Screenshot)

(Bild: Microsoft)

Auf die Frage nach der Betriebssicherheit und Faktentreue gab Siebler zu bedenken, dass die KI nicht immer korrekt antworten werde, daher sei es nötig zu validieren. Microsoft erstellt ihm zufolge zurzeit Konfidenzmetriken, um dieses Problem anzugehen. Die Kunden verwendeten die KI-Unterstützung oftmals nur auf den eigenen Datensätzen, wobei es primär um Leseverständnis sowie Befragen von Bestandsdaten gehe – hier seien die Modelle bereits recht genau. Der vom Modell erzeugte Text bleibe aber generativ und sei somit nicht ohne Weiteres überprüfbar. "Da bauen wir einen Feedback-Loop drum herum mit Daumen hoch und Daumen runter", so Siebler – das sei ein iterativer Prozess. Zur KI-Integration in die hauseigene Suchmaschine, "das neue Bing", äußerte sich interessanterweise keiner der vier Microsoft-Beschäftigten. Die abschließende Diskussionsrunde war nicht offen für Publikumsfragen, und zu der Veranstaltung waren nur vorab angemeldete Teilnehmer zugelassen worden.

Lesen Sie auch

Interview zum AI Act: "Regulieren wir uns in der EU gerade tot?"

KI-Regulierung: Wie Google und Microsoft Stimmung gegen den AI Act machen

Interview mit Aleph Alpha und DFKI: "Gestalten statt verwalten – Europa kann KI"

KI-Regulierung ist zu wichtig, um sie dem Digitalminister zu überlassen

Microsoft und europäische KI-Regulierung – Fußnote

Zum Thema Regulierung gab Microsoft Germany sich im Rahmen der KI-Kickoff-Veranstaltung etwas offener, als es der in Brüssel hinterlegten Microsoft- und US-Position entspricht, und wies hier insbesondere auf die Gefahren von Regulierung für Innovation und die "Grassroot-Community" hin. "Open Source muss natürlich auch gedeihen können", sagte Janik. Fraglos ein wichtiges Anliegen, dessen Anwalt jedoch vermutlich nicht Microsoft heißt. Zum Thema versuchter Einflussnahme auf die europäischen Gesetzgebungsverfahren hatte die MIT Technology Review Anfang März 2023 berichtet, und vor einem Jahr hatten europäische Cloud-Anbieter eine Kartellbeschwerde wegen wettbewerbswidriger Praxis des Hyperscalers eingelegt. Vor diesem Hintergrund waren Bekenntnisse zu Fairness, Sicherheit, dem Recht auf Privatsphäre und Zuverlässigkeit womöglich eher als eine Botschaft an die Geschäftskunden und Partner zu verstehen.

Wer sich tiefer für die Aktivitäten von BigTech-Konzernen wie Microsoft rings um den AI Act in Brüssel interessiert, sei auf die Forschungsergebnisse der Lobbying-Kontrollgruppe Corporate Europe Observatory verwiesen, insbesondere deren Report "The Lobbying Ghost in the Machine" von Ende Februar 2023. Hinter den Kulissen scheint BigTech durchaus daran gelegen zu sein, seine generativen KI-Modelle von einem allzu starken Commitment auf KI-Sicherheit sowie europäische Rechtsnormen freizuhalten und stattdessen die Regulierungspflichten und Verantwortung für etwaigen Schaden auf europäische Anbieter und Nutzergruppen abzuwälzen.

Als potenzieller Kunde gilt es das mitzubedenken, da die im kommenden AI Act vorgesehenen Vertragsstrafen beim Einsatz hochriskanter KI (wozu ChatGPT und Co. derzeit noch gezählt werden) ein Unternehmen empfindlich treffen könnten, mit bis zu 30 Millionen Euro oder 6 Prozent vom jährlichen Umsatz. Die Details stehen im öffentlich einsehbaren Regulierungsentwurf in Artikel 71 unter "Sanktionen". Die Informationsveranstaltung von Microsoft war allerdings keine Pressekonferenz zu diesem Thema, sondern richtete sich wohl mehr an potenzielle oder bestehende Geschäftskunden sowie künftige Partnerunternehmen.

(sih)