KI-Update: OpenAI o3 und o4-mini, KI-Dronen, KI-Version von "Wizard of Oz"

Das "KI-Update" liefert werktäglich eine Zusammenfassung der wichtigsten KI-Entwicklungen.

vorlesen Druckansicht

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmung wird hier ein externer Podcast (Podigee GmbH) geladen.

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Podigee GmbH) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Lesezeit: 4 Min.
Von
Inhaltsverzeichnis

OpenAI hat mit o3 und o4-mini neue Modelle seiner o-Serie eingeführt, die als bisher intelligenteste Systeme des Unternehmens gelten. Die Kernneuerung liegt in der Fähigkeit der Modelle, alle in ChatGPT verfügbaren Werkzeuge – von Websuche über Python-basierte Datenanalyse bis hin zu Bildverarbeitung – selbstständig zu nutzen und zu kombinieren. Besonders bemerkenswert ist ihre agentische Entscheidungskompetenz: Die Systeme wählen eigenständig, wann und wie Werkzeuge einzusetzen sind, um komplexe Probleme typischerweise unter einer Minute zu lösen.

Eine weitere Innovation ist die Integration von Bildern in den Denkprozess. Die Modelle können Werkzeuge zur Bildmanipulation im Reasoning-Prozess einsetzen – etwa um eine auf dem Kopf stehende Handschrift zu zoomen, zu drehen und korrekt zu transkribieren. Beide Modelle stehen zahlenden ChatGPT-Nutzern bereits zur Verfügung, während ein leistungsstärkeres o3-pro mit vollem Tool-Support in einigen Wochen folgen soll.

OpenAI hat sein Sicherheitskonzept grundlegend überarbeitet, um potenzielle Risiken durch fortschrittliche KI-Systeme besser zu kontrollieren. Das Unternehmen konzentriert sich nun auf Fähigkeiten, die ernsthafte und nicht rückgängig zu machende Schäden verursachen könnten.

Das neue System teilt KI-Fähigkeiten in zwei Bereiche: bekannte Risiken mit bewährten Schutzmaßnahmen und noch wenig erforschte Gefahrenfelder, für die OpenAI spezielle Sicherheitskonzepte entwickelt. Je nach Gefährdungspotenzial müssen Systeme entweder vor der Veröffentlichung oder bereits während der Entwicklung abgesichert werden. OpenAI plant, künftig nicht nur Berichte über die Leistungsfähigkeit seiner Modelle zu veröffentlichen, sondern auch detaillierte Informationen zu den implementierten Schutzmaßnahmen. Die Überarbeitung erfolgt wenige Monate vor Inkrafttreten neuer EU-Vorschriften für KI-Systeme.

Microsoft hat seinen visuellen KI-Assistenten "Copilot Vision" nun auch für den Browser Edge freigegeben. Die Funktion ermöglicht es Nutzern, den Browser sehen zu lassen, was sie selbst sehen, und darüber in natürlicher Sprache zu kommunizieren. Die Anwendung ist allerdings noch auf bestimmte Websites wie Wikipedia, OpenTable und TripAdvisor beschränkt. Microsoft plant, Copilot Vision künftig auch in Windows zu integrieren.

Parallel dazu hat Google seinen Bilderkennungsdienst Gemini Live für alle Android-Geräte kostenlos zugänglich gemacht. Die Funktion erlaubt Nutzern nicht nur Bildschirminhalte zu teilen, sondern auch die Smartphone-Kamera für die KI freizugeben, wodurch ein natürliches Gespräch über das Gesehene möglich wird.

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmung wird hier ein externer Podcast (Podigee GmbH) geladen.

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Podigee GmbH) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Eine autonome, KI-gesteuerte Drohne der Delft University of Technology hat erstmals menschliche Weltmeister in einem offiziellen Wettbewerb geschlagen. Mit Geschwindigkeiten von bis zu 95,8 km/h meisterte sie einen anspruchsvollen Parcours schneller als drei ehemalige Champions der Drone Champions League.

Der Sieg unterscheidet sich von früheren Erfolgen durch seinen offiziellen Rahmen: Während 2023 eine KI-Drohne der University of Zürich unter Laborbedingungen gewann, legten bei diesem Rennen in Abu Dhabi die Veranstalter Hardware und Strecke fest. Die Technologie, die auf einem tiefen neuronalen Netzwerk basiert und mit verstärkendem Lernen trainiert wurde, hat Potenzial für zeitkritische Einsätze wie Medikamentenlieferungen oder Rettungsmissionen.

Podcast: KI-Update
KI-Update

Wie intelligent ist Künstliche Intelligenz eigentlich? Welche Folgen hat generative KI für unsere Arbeit, unsere Freizeit und die Gesellschaft? Im "KI-Update" von Heise bringen wir Euch gemeinsam mit The Decoder werktäglich Updates zu den wichtigsten KI-Entwicklungen. Freitags beleuchten wir mit Experten die unterschiedlichen Aspekte der KI-Revolution.

Google wird Ende August eine KI-erweiterte Version des Filmklassikers "Wizard of Oz" auf die 180-Grad-Leinwand der Las Vegas Sphere bringen. Das Projekt geht weit über herkömmliches Remastering hinaus: Der körnige 4:3-Film von 1939 wird nicht nur auf 16K mal 16K hochskaliert, sondern durch KI-generierte Szenen ergänzt, die im Original nicht vorhanden waren.

Die von Magnopus, einer Special-Effects-Firma, in Zusammenarbeit mit Google DeepMind und Google Cloud realisierte Produktion nutzt generative KI-Modelle wie Imagen, Veo und Gemini. Das Team konnte auf das handgeschriebene Notizbuch des Original-Kameramanns zurückgreifen, um Szenen zu rekonstruieren.

(mali)