KI-Update kompakt: Google I/O, ChatGPT-Desktop-App, BioHive-2, Hippocampus

Das "KI-Update" liefert werktäglich eine Zusammenfassung der wichtigsten KI-Entwicklungen.

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmmung wird hier ein externer Podcast (Podigee GmbH) geladen.

Podcasts immer laden

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Podigee GmbH) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

15.05.2024, 15:00 Uhr

Lesezeit: 6 Min.

Von

Isabel Grünewald
The Decoder

Google I/O steht ganz im Zeichen von KI

Google stellte auf seiner Entwicklerkonferenz I/O zahlreiche KI-Innovationen vor. CEO Sundar Pichai betonte die langjährige Investition des Unternehmens in diesem Bereich. Besonders häufig fiel der Begriff "Gemini", der Name von Googles eigener KI-Plattform. Gemini 1.5 Pro mit einem Kontextfenster von bis zu zwei Millionen Token wird nun für Entwickler und Cloud-Kunden verfügbar sein. Die effiziente Variante Gemini 1.5 Flash soll Kosten senken.

Die Video-KI Veo tritt in Konkurrenz zu OpenAIs Sora und generiert Videos von über einer Minute Länge. Der Bildgenerator Imagen wurde in Version 3 vorgestellt. Die Suche erhält mit AI Overview KI-generierte Zusammenfassungen oberhalb der Ergebnisse. Project Astra bündelt die Entwicklung von KI-Agenten, die mittels Smartphones erreichbar sein sollen.

Auch die visuelle Suche wird ausgebaut, um Videos als Eingabe zu verarbeiten und dazugehörige Fragen zu beantworten. Laut Liz Reid, Head of Search, wird Google künftig vielfältige Aufgaben wie Suchen, Vereinfachen, Recherchieren und Planen übernehmen.

Desktop-App für ChatGPT zuerst nur für den Mac

OpenAI hat im Rahmen des Spring-Updates angekündigt, eine native ChatGPT-Anwendung für den Mac-Desktop herauszubringen, die Windows-Version soll später folgen. Die App wird im Laufe der nächsten Wochen an die ersten Nutzer mit ChatGPT Plus Abonnement verteilt und über das Web-Interface des Chatbots erhältlich sein. Sie ermöglicht den Zugriff auf den KI-Chatbot per Tastenkombination und akzeptiert neben Texteingaben auch Screenshots, Dateien, Fotos und Spracheingaben.

Bei der Präsentation demonstrierte OpenAI, wie die App beim Programmieren assistieren kann, indem sie Code erklärt und weiterverarbeitet. Parallel dazu überarbeitet das Unternehmen sein Web-Interface mit einem neuen Home-Screen und einer verbesserten Nachrichtenanzeige. Die iOS-Version von ChatGPT unterstützt bereits GPT-4o, entspricht aber noch nicht dem neuen Design. Derzeit verteilt OpenAI den Zugang zur Mac-App nur langsam an ausgewählte Nutzer.

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmmung wird hier ein externer Podcast (Podigee GmbH) geladen.

Podcasts immer laden

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Podigee GmbH) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Sutskever verlässt OpenAI

OpenAI, Entwickler von ChatGPT und GPT-4, steht vor personellen Veränderungen auf höchster Ebene. Ilya Sutskever, Mitbegründer und Chefwissenschaftler, gab seinen Abschied bekannt, um sich einem persönlich bedeutsamen Projekt zu widmen. Auch Jan Leike, Forscher für KI-Sicherheit, erklärte seinen Rücktritt, ohne nähere Gründe zu nennen.

Sutskever und Leike arbeiteten an Sicherheitskonzepten für die Kontrolle einer potenziell gefährlichen Superintelligenz. Sutskevers Nachfolge übernimmt Jakub Pachocki, der bisher wichtige Projekte wie GPT-4 leitete.

Der Ende 2022 überraschend entlassene und später wieder eingesetzte CEO Sam Altman drückte in einer Mitteilung sein Bedauern über Sutskevers Weggang aus. Er sei jedoch zuversichtlich, dass OpenAI unter der neuen wissenschaftlichen Leitung die Entwicklung einer sicheren und nützlichen allgemeinen künstlichen Intelligenz (AGI) weiter vorantreiben werde.

Apple veröffentlicht Updates für Logic Pro mit viel KI

Apple hat die neuen Versionen Logic Pro für iPad 2 und Logic Pro für Mac 11 mit mehreren KI-Funktionen präsentiert. Die Session Players sind virtuell generierte Schlagzeuger, Keyboarder und Bassisten, die eine Gesangsspur analysieren und dazu passende Begleitungen erstellen. Deren Spiel lässt sich vom Anwender mit diversen Einstellungen anpassen.

Der Stem Splitter ermöglicht es, Aufnahmen von Livekonzerten neu abzumischen und einzelne Elemente zu entfernen. Die KI separiert Gesang, Schlagzeug, Bass und andere Instrumente. So kann die Lautstärke von Gitarren reduziert werden, während der Rest der Musik unverändert bleibt. Auch das Extrahieren von Gesangsspuren und die Kombination mit einer KI-generierten Begleitung ist möglich.

Weitere Neuerungen umfassen Verbesserungen der Studioassistenz, eine globale Akkordspur und ChromaGlow zum Hinzufügen analoger Soundeffekte. Die Updates erfordern mindestens den A12 Bionic Chip und iPadOS 17.4 bzw. macOS 13.5. Logic Pro für iPad kostet 4,99 Euro monatlich oder 49 Euro jährlich, die Mac-Version 229,99 Euro.

Recursion beschleunigt Medikamentenentwicklung mit BioHive-2

Das Biopharma-Unternehmen Recursion will die Medikamentenentdeckung deutlich voranbringen. Dazu hat es den leistungsfähigsten Superrechner der Pharmabranche, BioHive-2, in Betrieb genommen. Das System belegt Platz 35 der TOP500-Liste der schnellsten Supercomputer weltweit.

BioHive-2 ist mit 504 Nvidia H100 GPUs ausgestattet und erreicht eine KI-Performance von 2 Exaflops. Damit übertrifft es den Vorgänger BioHive-1 um das Fünffache. Mit KI soll sich die jahrelange Entwicklung neuer Wirkstoffe, die normalerweise Millionen Laborexperimente erfordert, drastisch verkürzen.

"Mit KI im Einsatz können wir heute 80 Prozent des Wertes mit 40 Prozent der Laborarbeit erreichen, und dieses Verhältnis wird sich in Zukunft noch verbessern“, so Ben Mabey, CTO von Recursion. Biologie sei jedoch unglaublich komplex, daher werde es Jahre dauern, bis sich dieser Ansatz sein volles Potenzial entfaltet.

"Aber im Rückblick werden die Menschen erkennen, dass dies ein echter Wendepunkt im Gesundheitswesen war", so Mabey.

Funktion des Hippocampus durch KI-Modell besser verstehen

Forschende der Columbia University und Google DeepMind haben ein Deep-Learning-Modell entwickelt, das nicht nur Aufgaben löst, sondern dabei auch von ihm in der Umgebung hervorgerufene Veränderungen vorhersagt. Dieses Vorhersagelernen beschleunigte den Lernprozess und half dem Modell, sich flexibler an neue Ziele anzupassen.

Laut dem Team zeigten sich Ähnlichkeiten zwischen den Aktivitätsmustern im Vorhersagemodul des KI-Modells und dem Hippocampus von Tieren. Es bildeten sich im KI-Netz funktionale Alternativen zu sogenannte Ortszellen, die an bestimmten Positionen im Raum aktiv werden – nur in diesem Fall eben im virtuellen Raum. Die Ergebnisse deuten darauf hin, dass Vorhersagelernen ein Schlüsselmechanismus sein könnte, mit dem der Hippocampus nützliche Repräsentationen für andere Hirnareale bereitstellt, ohne selbst direkt Handlungssequenzen zu generieren oder Planungsprozesse zu unterstützen.

Die Studie zeigt, wie Deep-Learning-Systeme als Modell für die Interaktion verschiedener Hirnregionen dienen können. Die Erkenntnisse könnten auch neue Ansätze für effizienteres maschinelles Lernen und flexiblere KI inspirieren.

Wie intelligent ist Künstliche Intelligenz eigentlich? Welche Folgen hat generative KI für unsere Arbeit, unsere Freizeit und die Gesellschaft? Im "KI-Update" von Heise bringen wir Euch gemeinsam mit The Decoder werktäglich Updates zu den wichtigsten KI-Entwicklungen. Freitags beleuchten wir mit Experten die unterschiedlichen Aspekte der KI-Revolution.