KI-Update kompakt: Altman & Ive, Multi-Agenten, Microsoft, KI-Governance

Das "KI-Update" liefert werktäglich eine Zusammenfassung der wichtigsten KI-Entwicklungen.

In Pocket speichern vorlesen Druckansicht

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmmung wird hier ein externer Podcast (Podigee GmbH) geladen.

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Podigee GmbH) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Lesezeit: 9 Min.
Von
Inhaltsverzeichnis

Jony Ive, ehemaliger Chef-Designer von Apple, und Sam Altman, OpenAI-Chef, arbeiten gemeinsam an einer neuen KI-Hardware. Ive hat mit der New York Times über das Projekt gesprochen, verrät aber wenig Details. Stattdessen geht es im Porträt um Ives Aktivitäten seit seinem Weggang von Apple vor fünf Jahren, wie die Mitgestaltung der Met Gala und den Kauf eines Häuserblocks in San Francisco. Ives Designfirma LoveFrom hat diverse Kunden wie Ferrari und Airbnb.

Für OpenAI übernimmt LoveFrom nun den Design-Auftrag eines unbekannten KI-Produkts. Dafür haben Altman und Ive ein Start-up gegründet und wollen bis Jahresende eine Milliarde Dollar von Investoren einsammeln. Das Gerät soll weniger "sozial störend" als das iPhone sein und mithilfe von KI ein neues Computererlebnis schaffen. Weitere Details zur Entwicklung oder einem Zeitplan gibt es bislang nicht.

Amazon hat auf seiner Accelerate-Konferenz einen KI-gestützten Videogenerator für Werbetreibende präsentiert. Das neue Tool namens "Video Generator" kann aus einem einzelnen Produktbild kurze Videoclips erzeugen, die die Eigenschaften des Produkts präsentieren. Der Videogenerator nutzt laut Amazon die "einzigartigen Einzelhandelserkenntnisse" des Unternehmens, um Produktgeschichten lebendig zu machen.

Die erzeugten Videos sind 6-9 Sekunden lang und haben eine Auflösung von 720p. Aktuell befindet sich das Tool in einer begrenzten Beta-Phase und steht nur ausgewählten US-Werbetreibenden zur Verfügung.

Amazon plant, den Videogenerator in den kommenden Monaten weiterzuentwickeln, bevor er breiter verfügbar gemacht wird.

Zusätzlich kündigte Amazon eine Funktion namens "Live Image" an. Diese erzeugt kurze animierte GIFs aus Standbildern und soll ebenfalls das Marketing-Instrumentarium der Händler erweitern.

Johann Bizer, Chef des IT-Dienstleisters Dataport, sieht angesichts des Fachkräftemangels eine umfassende Algorithmisierung der öffentlichen Verwaltung als nötig an. Nur so ließen sich Bürgerservices aufrechterhalten. Dabei gehe es primär um Automatisierung, KI sei ein Teilaspekt. Dataport entwickle "Verwaltung-as-a-Service"-Angebote mit Preisschild, die sich bundesweit ausrollen ließen. Beispiele seien die weitgehend automatisierte Steuererklärung oder Bußgeldverfahren. Auch Dinge wie CO2-Messungen sollten nicht über Formulare, sondern Sensordaten laufen.

Die Politik müsse mehr die Organisations- und Prozessveränderung vorantreiben statt einzelne KI-Leuchttürme. Gleichzeitig dürfe man nicht auf einstimmige Lösungen warten. US-Technik sei teils unverzichtbar, Nachfragebündelung aber wichtig für den Aufbau europäischer Alternativen. Die DSGVO erschwere die Nutzung von Trainingsdaten. Sensible KI-Anwendungen hoste Dataport selbst, einfachere kaufe man als Service ein.

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmmung wird hier ein externer Podcast (Podigee GmbH) geladen.

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Podigee GmbH) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

OpenAI sucht Verstärkung für ein neues Forschungsteam im Bereich Multi-Agenten-Systeme. Die Entwicklung von KI-Agenten entspricht der dritten Stufe auf OpenAIs kürzlich vorgestellter fünfstufiger Skala zur Messung des Fortschritts in Richtung AGI. Mit dem o1-Modell sieht sich OpenAI laut CEO Sam Altman derzeit auf der zweiten Stufe, den sogenannten "Reasoners".

Laut Noam Brown, der das neue Team leitet, sieht OpenAI in der Forschung einen Weg zu besseren KI-Fähigkeiten, insbesondere für verbessertes Schlussfolgern. Brown, der zuvor bei Facebook AI Research tätig war, ist bekannt für seine Arbeit an KI-Systemen, die menschliche Spieler in komplexen Spielen wie Poker und Diplomacy besiegen können.

Bei seiner Arbeit mit diesen Systemen, etwa der Poker-KI Libratus, beschäftigte er sich auch mit dem Konzept der "Test-Time Compute" - mehr Rechenzeit für Antworten führte zu besseren Spielzügen. Von FAIR wechselte er zu OpenAI, um seine Arbeit und die Konzepte auf Sprachmodelle zu übertragen. OpenAIs jüngsten o1-Modell ist ein Ergebnis dieser Arbeit.

Podcast: KI-Update

Wie intelligent ist Künstliche Intelligenz eigentlich? Welche Folgen hat generative KI für unsere Arbeit, unsere Freizeit und die Gesellschaft? Im "KI-Update" von Heise bringen wir Euch gemeinsam mit The Decoder werktäglich Updates zu den wichtigsten KI-Entwicklungen. Freitags beleuchten wir mit Experten die unterschiedlichen Aspekte der KI-Revolution.

Beim anstehenden UN-Zukunftsgipfel will sich die UNO grünes Licht für eine neue Rolle in der globalen KI-Governance geben lassen. Eine vom Generalsekretär eingesetzte Expertengruppe schlägt dafür ein KI-Sekretariat, einen wissenschaftlichen KI-Beirat, zwei jährliche Governance-Dialoge und weitere Prozesse vor.

Ziel ist es, auch Länder des globalen Südens einzubinden, die bisher an keinen KI-Regelungen beteiligt sind. Ein KI-Rat nach Vorbild des Weltklimarats IPCC soll regelmäßig Berichte zu Forschung und Risiken vorlegen. Die Vorschläge sollen in den "Global Digital Compact", die neue Digitalcharta der UN, einfließen. Über eine eigene KI-Aufsichtsbehörde analog zur Atomaufsicht wurde diskutiert, dies sehen die Experten aber derzeit nicht als nötig an. Insgesamt will sich die UNO als zentrale Plattform für den globalen Austausch zu KI-Fragen etablieren.

Alibaba hat mit Qwen 2.5 eine umfangreiche neue Generation von KI-Modellen vorgestellt. Die Modellreihe umfasst Varianten für allgemeine Sprache, Programmierung und Mathematik in verschiedenen Größen von 0,5 bis 72 Milliarden Parametern.

Laut Alibaba übertrifft das größte Modell Qwen2.5-72B in Benchmarks wie MMLU führende Open-Source-Modelle wie Metas Llama-3.1-70B. Auch kleinere Varianten sollen mit größeren Konkurrenzmodellen mithalten können. Die Qwen2.5-Modelle wurden auf einem Datensatz von bis zu 18 Billionen Token trainiert und unterstützen über 29 Sprachen.

Die spezialisierten Qwen2.5-Coder für Programmieraufgaben und Qwen2.5-Math für mathematische Berechnungen gehören ebenfalls zu den veröffentlichten Modellen. Letzteres soll in Benchmarks sogar Modelle wie GPT-4 und Claude 3.5 übertreffen. Die meisten Qwen2.5-Modelle sind als Open Source unter der Apache-2.0-Lizenz verfügbar. Ausnahmen bilden die 3B- und 72B-Varianten. Zusätzlich bietet Alibaba mit Qwen-Plus und Qwen-Turbo API-Zugang zu seinen leistungsfähigsten Modellen. Alibaba plant, in Zukunft noch größere Modelle zu trainieren, auch mit multimodalen Fähigkeiten für Bild- und Audiodaten.

Microsoft gründet mit Investoren wie Blackrock, Global Infrastructure Partners und MGX aus Abu Dhabi die Global AI Infrastructure Investment Partnership (GAIIP). Gemeinsam wollen sie initial 30 Milliarden Dollar Beteiligungskapital erschließen, mit Fremdfinanzierung sogar bis zu 100 Milliarden Dollar. Das Geld fließt in den Bau von KI-Rechenzentren mit hunderttausenden GPU-Beschleunigern sowie in die nötige Energieinfrastruktur wie Kraftwerke und Solarparks.

Nvidia wird als Hardwarepartner erwähnt, die Rechenzentren sollen aber offen für diverse Partner sein. Der Großteil der Investitionen ist für die USA vorgesehen, der Rest für Partnerländer. Mit den Supercomputern will sich Microsoft im Wettrennen um Künstliche Intelligenz an die Spitze setzen.

Apple startet die Public Beta seiner KI-Funktionen "Apple Intelligence" zunächst nur auf US-Englisch. iOS 18.1, iPadOS 18.1 und macOS 15.1 bieten Zugang, wenn man die Systemsprache ändert und einen US-App-Store-Account nutzt. Im EU-Raum ist dies auf iPhones und iPads aktuell durch Geofencing erschwert, auf Macs aber ab Oktober möglich. Die Beta enthält vor allem textbezogene KI-Funktionen wie Korrektur, Umschreiben und Zusammenfassen, Antwortvorschläge, einen getippten Siri-Modus sowie erste Bildfunktionen für Diashows und Objektentfernung.

Weitere Funktionen wie Bildgenerierung folgen später. Deutsche Sprachunterstützung ist für 2025 geplant. Wann die EU-Kommission die Freigabe der Funktionen unter dem Digital Markets Act erteilt, ist offen.

Der chinesische Hersteller Pudu Robotics hat mit dem Pudu D7 einen teilhumanoiden Roboter für Service-Aufgaben etwa im Einzelhandel, der Gastronomie und im Gesundheitswesen vorgestellt. Der 1,65 m große, 45 kg schwere Roboter kombiniert einen humanoiden Oberkörper mit Kopf und Armen mit einer omnidirektionalen rollenden Basis.

Die Arme haben je 30 Freiheitsgrade, austauschbare Hände und können zusammen bis zu 20 kg heben. Der Roboter erreicht bis zu 7,2 km/h, überwindet Steigungen bis 10 Grad und hält mit einer Akkuladung 8 Stunden durch. Laut Pudu lernt der D7 durch Datenanalyse und KI-Modelle kontinuierlich dazu, um komplexe Serviceaufgaben zu meistern, bei denen spezialisierte Roboter an ihre Grenzen stoßen. Einen Preis nannte das Unternehmen noch nicht.

Zum Schluss noch eine Meldung in eigener Sache. Die jährlich stattfindenden Hannah-Arendt-Tage in Hannover dienen dazu, die Erinnerung an die international anerkannte Politiktheoretikerin Hannah Arendt wachzuhalten. Ihr umfangreiches Werk, insbesondere ihre zentrale Frage nach dem Sinn politischer Freiheit, bietet zahlreiche Anregungen für gesellschaftliche Diskussionen. Dem Thema "Künstliche Intelligenz und ihre Auswirkungen auf unsere Freiheit" widmet sich die Veranstaltungsreihe am 25. Oktober.

Dabei sind wir, also das Medienhaus heise, zum wiederholten Male Gastgeber bei den Hannah-Arendt-Tagen. Im Fokus der Diskussion stehen die zentralen Fragen: Wie lassen sich Potenziale und Risiken von KI sinnvoll vermitteln? Welche Freiheiten ermöglicht sie und wo muss sie zum Schutz von Kommunikation, Bildung und Vertrauen begrenzt werden? Welchen Beitrag leistet KI tatsächlich für die Gesellschaft? Meine Kollegin Eva-Maria Weiß wird den Abend moderieren. Die Podiumsdiskussion beginnt um 18 Uhr.

(igr)