KI-Update kompakt: Brockman, GEMA-Klage, KI-Agent "Operator", DeepL Voice

Das "KI-Update" liefert werktäglich eine Zusammenfassung der wichtigsten KI-Entwicklungen.

In Pocket speichern vorlesen Druckansicht

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmmung wird hier ein externer Podcast (Podigee GmbH) geladen.

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Podigee GmbH) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Lesezeit: 9 Min.
Von
Inhaltsverzeichnis

OpenAI-Mitbegründer Greg Brockman beendet sein Sabbatical und kehrt in das Unternehmen zurück. Seine künftige Rolle wird derzeit mit CEO Sam Altman ausgearbeitet und soll sich auf "bedeutende technische Herausforderungen" fokussieren. Die Rückkehr erfolgt in einer Phase, in der mehrere Führungskräfte wie CTO Mira Murati, die Mitbegründer John Schulman und Ilya Sutskever sowie Sicherheitsforscherin Lilian Weng das Unternehmen verlassen haben.

Brockman erwies sich bereits während der kurzzeitigen Absetzung von Sam Altman im November 2023 als loyaler Unterstützer, als er aus Solidarität kündigte und mit Altmans Rückkehr ebenfalls zurückkehrte. Sein Sabbatical, das er im August antrat, war seine erste Pause seit der OpenAI-Gründung vor neun Jahren. Bereits bei Antritt kündigte er seine geplante Rückkehr an, mit dem Ziel, eine "sichere AGI" zu entwickeln.

Der US-amerikanische Halbleiterkonzern AMD entlässt vier Prozent seiner weltweiten Belegschaft. Das entspricht etwa 1.000 Mitarbeitenden. Das Unternehmen wolle sich auf die Entwicklung von Chips für künstliche Intelligenz (KI) konzentrieren, um mit dem Branchenprimus Nvidia konkurrieren zu können, wie die Nachrichtenagentur Reuters berichtet. Der Markt für KI-Chips ist hart umkämpft. Die leistungsstarken Chips können gewaltige Datenmengen verarbeiten und bilden das Herzstück generativer KI-Technologie. Marktführer Nvidia ist nicht zuletzt aufgrund des KI-Booms heute das wertvollste Unternehmen aller Zeiten. Unternehmen wie Amazon Web Services (AWS), Intel oder eben AMD wollen Schritt halten. AMD hat daher stark in die Entwicklung von KI-Chips investiert und plant laut Reuters, im vierten Quartal des Jahres mit der Massenproduktion einer neuen Version seines KI-Chips namens MI325X zu beginnen. Aufgrund der begrenzten Fertigungskapazitäten ist die Ausweitung der Produktion von KI-Chips ein teures Unterfangen. Zuletzt sind die Forschungs- und Entwicklungskosten des Unternehmens gestiegen; der Aktienkurs dagegen hat im Laufe des Jahres rund vier Prozent verloren. Dafür soll nun bei der Belegschaft gespart werden.

Nvidia hat erste Benchmark-Ergebnisse seiner neuen Blackwell-Plattform für das Training von KI-Modellen veröffentlicht. In den MLPerf Training 4.1 Benchmarks zeigte Blackwell im Vergleich zur Vorgängergeneration Hopper bis zu 2,2-mal mehr Leistung pro GPU. Nvidia erwartet weitere Leistungssteigerungen durch Software- und Netzwerk-Updates. Erst im September feierte Blackwell sein Debüt beim MLPerf Inference 4.1 Benchmark für KI-Inferenz.

Dort lieferte die GPU bis zu viermal mehr Leistung als die Hopper-Generation, auch durch Verwendung der niedrigeren FP4-Präzision. Nvidia sieht durch aktuelle Trends wie Chatbots mit niedriger Latenz und KI-Modelle, die "Nachdenken", einen neuen Fokus auf die Skalierung der Rechenleistung zur Inferenz-Zeit, zusätzlich zum anhaltenden Trend zu mehr Trainingsleistung. Bereits im nächsten Jahr soll mit Blackwell Ultra der nächste leistungsstärkere KI-Beschleuniger auf den Markt kommen.

Die KI-Antwortmaschine Perplexity führt in den USA ein neues Werbeformat ein. Statt Klicks zu verkaufen, zeigt das Unternehmen gesponserte Folgefragen neben den von der KI generierten Antworten an. Zu den ersten Werbepartnern gehören Indeed, Whole Foods, Universal McCann und PMG. Perplexity betont, dass die Antworten auf gesponserte Fragen weiterhin von der KI generiert und nicht von den Werbetreibenden beeinflusst werden. Auch erhalten die Werbepartner keinen Zugriff auf persönliche Nutzerdaten der Anwenderinnen und Anwender. Ein Teil der Werbeeinnahmen soll an ausgewählte Verlage gehen, deren Inhalte Perplexity nutzt, um die KI-Antworten zu generieren. Erste Klagen gegen das Start-up wegen unerlaubter Nutzung dieser Inhalte laufen bereits.

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmmung wird hier ein externer Podcast (Podigee GmbH) geladen.

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Podigee GmbH) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Die Verwertungsgesellschaft GEMA verklagt OpenAI vor dem Landgericht München. Der Vorwurf: OpenAI habe die Texte der Lieder von GEMA-Mitgliedern für das Training von ChatGPT widerrechtlich verwendet. "Die Songs unserer Mitglieder sind nicht der kostenlose Rohstoff für die Geschäftsmodelle der Anbieter generativer KI-Systeme", sagt GEMA-Geschäftsführer Tobias Holzmüller. OpenAI müsse Lizenzen erwerben und die Urheber fair vergüten, lautet die Forderung. Die GEMA glaubt, dass sie OpenAI bei der Frage der Songtexte gut nachweisen kann, dass der Anbieter gleich mehrfach gegen das Urheberrecht verstoßen habe: Nicht nur die Verarbeitung, sondern auch unerlaubte Abwandlungen seien durch ChatGPT entstanden – aus Sicht der GEMA sind das Verstöße gegen das Urheberpersönlichkeitsrecht.

Die GEMA will mit ihrer Klage vor dem Landgericht München nun eine Klärung der Rechtslage herbeiführen. Eine Möglichkeit ist, dass das Gericht zur Klärung des Sachverhaltes Vorlagefragen an den Europäischen Gerichtshof formuliert. Gewinnt die GEMA das Verfahren, könnten OpenAI nicht nur massive Zahlungsverpflichtungen treffen – sondern auch die Pflicht, alle GEMA-Repertoire-Tokens aus den Datengrundlagen der Modelle zu löschen und diese zurückzusetzen.

Podcast: KI-Update

Wie intelligent ist Künstliche Intelligenz eigentlich? Welche Folgen hat generative KI für unsere Arbeit, unsere Freizeit und die Gesellschaft? Im "KI-Update" von Heise bringen wir Euch gemeinsam mit The Decoder werktäglich Updates zu den wichtigsten KI-Entwicklungen. Freitags beleuchten wir mit Experten die unterschiedlichen Aspekte der KI-Revolution.

OpenAI plant laut einem Bloomberg-Bericht die Einführung eines KI-Agentensystems namens "Operator" für Januar. Der Agent soll selbstständig Computeraufgaben wie Codieren oder Reisebuchungen ausführen können. Zunächst soll "Operator" als Forschungsvorschau und API für Entwickler verfügbar sein. OpenAI-CEO Sam Altman sieht in KI-Agenten den nächsten Wachstumshorizont für künstliche Intelligenz. Er glaubt, dass es künftig darum geht, existierende Sprachmodelle intelligenter einzusetzen.

OpenAI folgt damit einem Branchentrend zur Automatisierung komplexer Arbeitsabläufe durch KI-Agenten. Auch Anthropic, Microsoft und Google entwickeln ähnliche Assistenzsysteme. Durch Verknüpfung vieler Agenten, die verlässlich Einzelaufgaben erledigen, soll die Automatisierung ganzer Arbeitsprozesse möglich werden. Wann die dafür notwendige Zuverlässigkeit erreicht werden kann, ist aber noch unklar. Bisherige Ansätze wie Anthropics kürzlich gestartete Computer-Use-Funktion sind noch nicht so weit.

Das Kölner KI-Unternehmen DeepL erweitert sein Angebot mit DeepL Voice, einem Tool für Echtzeit-Sprachübersetzungen. Das System kann 13 gesprochene Sprachen erkennen und in 33 verschiedene Sprachen übersetzen. Es ist für Remote-Meetings und persönliche Gespräche konzipiert und kann mehrere Sprachen simultan verarbeiten.

DeepL nutzt ein eigenes Sprachmodell, das laut Unternehmensangaben bessere Übersetzungsqualität als Konkurrenzprodukte von Google, OpenAI und Microsoft bietet. CEO Jaroslaw Kutylowski betont die besonderen Herausforderungen bei der Entwicklung, wie unvollständige Sätze und undeutliche Aussprache.

Das Unternehmen, das nach einer Finanzierungsrunde 2022 den "Einhorn"-Status erreichte, hat seine Belegschaft auf 900 Mitarbeiter verdoppelt und einen US-Standort in Austin eröffnet. DeepL Voice wurde auf der hauseigenen Konferenz "Dialogues" in Berlin vorgestellt und ist zunächst nur für Unternehmenskunden über das Vertriebsteam verfügbar.

Der Betreiber des Bildagenturdienstes Getty Images hat ein Update für seinen KI-Bildgenerator vorgestellt, mit dem sich Produktaufnahmen einbinden lassen und neue Bilder anhand von Referenzfotos entstehen. Der Anbieter setzt dabei auf kommerzielle Sicherheit: Ende 2023 hatte Getty Images seinen KI-Bildgenerator vorgestellt, der in Kooperation mit Nvidia entstand. Er wurde mit Fotos der Kreativ-Bibliothek von Getty und iStock trainiert, also ausschließlich mit Material, für das der Anbieter eine Lizenz besitzt. Das soll Klagen auf Urheberrechtsverletzungen vorbeugen. Darüber hinaus bietet Getty Images einen automatischen Rechtsschutz in Höhe von 10.000 US-Dollar pro Bild.

Mit dem Update des Bildgenerators sollen jetzt professionell wirkende Produktbilder entstehen. Das soll bei Marketing- und Werbekampagnen Zeit und Kosten sparen. Nutzerinnen und Nutzer können eigene Produktbilder hochladen und nach Eingabe eines Prompts einen Hintergrund erstellen. Der Bildgenerator soll überblenden sowie Licht und Schatten einstellen. Farben und Bildkomposition des Bildgenerators lassen sich über Referenzbilder steuern. Eine vergleichbare Funktion bieten auch die Konkurrenten Dall-E, Midjourney, Adobe Firefly und Stable Diffusion. Die Funktionen Produktbild und Referenzbild stehen ab sofort in den Bildgeneratoren „Generative KI von Getty Images“ und „Generative KI von iStock“ zur Verfügung.

Nach über 10 Jahren vollzieht Final Cut Pro den nächsten großen Versionssprung zu Final Cut Pro 11. Die Hauptneuerungen sind neue KI-Tools sowie der Support für die Bearbeitung räumlicher respektive stereoskopischer Videos (Spatial Videos). Neu ist das magnetische Auswahlwerkzeug "Magnetic Mask", das eine flexiblere Anpassung bestimmter Objekte in Videos ermöglichen soll. Eine weitere KI-Funktion automatisiert das Erstellen von Untertiteln in der Timeline, indem die Audiospur transkribiert wird. Dafür komme ein Apple-Sprachmodell zum Einsatz, teilte das Unternehmen mit.

Final Cut Pro 11 lässt sich zwar noch auf macOS 14 installieren, Funktionen wie das Transkribieren benötigen aber das neue macOS 15. Und manche Features benötigen einen Mac mit Apple-Chip, merkt der Hersteller an. Die iPad-Version von Final Cut hat Apple ebenfalls ergänzt: Dort können Nutzerinnen und Nutzer KI-gestützte Licht- und Farbverbesserungen vornehmen sowie mit dem Apple Pencil auf neue Stiftwerkzeuge zurückgreifen, um Animationen einzufügen.

(igr)