KI-Update kompakt: OpenAI OS, Meta Open Source, Alexa wer, KI-Paper

Das "KI-Update" liefert werktäglich eine Zusammenfassung der wichtigsten KI-Entwicklungen.

In Pocket speichern vorlesen Druckansicht

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmmung wird hier ein externer Podcast (Podigee GmbH) geladen.

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Podigee GmbH) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Lesezeit: 7 Min.
Von
  • The Decoder
Inhaltsverzeichnis

OpenAI treibt die Integration seiner KI-Technologie in den Desktop-Bereich voran. Mit der Übernahme des Start-ups Multi und der Einführung einer Desktop-Anwendung für ChatGPT könnte das Unternehmen an der Entwicklung eines KI-basierten Betriebssystems arbeiten.

Multi hat eine Zoom-basierte Video-Kollaborationsplattform für Remote-Teams entwickelt und bereits an der Integration generativer KI für Zusammenfassungen und Referenzen gearbeitet. Das Start-up hatte vor der Übernahme 13 Millionen Dollar von Investoren erhalten. Das Multi-Team sieht in der Frage, wie wir mit Computern arbeiten sollten, eine der wichtigsten Produktfragen unserer Zeit.

Laut Ben Newhouse, Entwickler bei OpenAI, arbeitet das Unternehmen an einem "branchendefinierenden" Produkt, das die neuesten Modelle nutzt. Ein Stellenangebot für die Entwicklung einer Desktop-Anwendung spricht ebenfalls von einem "zero-to-one"-Produkt. Das könnte eine Art KI-Betriebssystem oder zumindest eine KI-Interaktionsschicht für ein Betriebssystem werden.

Ein solches Produkt von OpenAI könnte die Art und Weise, wie wir mit Computern und Online-Inhalten interagieren, grundlegend verändern. Der Browser als primäre Schnittstelle zum Internet könnte durch einen allgegenwärtigen KI-Assistenten ersetzt werden, was die Rolle von Suchmaschinen und Websites stark beeinflussen würde.

Aber auch klassische Apps würden womöglich stärker in den Hintergrund treten – ähnliche Ideen hatten auch zuletzt die mehr oder weniger gescheiterten Produkte wie Rabbit R1 und ihre Large Action Models.

Die Multi-App wird am 24. Juli 2024 eingestellt. Bestehende Nutzer können den Dienst bis dahin weiterhin nutzen, danach werden alle Nutzerdaten gelöscht.

Meta hat zu einem Tag der KI nach Berlin geladen, um über die KI-Forschung und -Entwicklung des Unternehmens zu informieren. Naila Murray, Forschungsleiterin von FAIR (Fundamental AI Research) bei Meta, betont, dass KI schon lange Teil von Metas DNA ist und nun vom Hintergrund in den Vordergrund rückt, sodass Nutzer direkt mit KI interagieren können.

Meta stellt ein neues AI Accelerator Programm für Startups vor, das in Zusammenarbeit mit Hugging Face und Scaleway den Zugang zu neuesten KI-Modellen und Ressourcen bietet. Außerdem kündigt Meta an, die eigenen KI-Modelle als Open-Source zur Verfügung zu stellen, um Sicherheit, Wettbewerb und Fortschritt zu fördern. Weitere Details zu einer neuen Infrastruktur für den weitläufigen Einsatz von KI sollen in Kürze folgen.

Das Podium mit Experten wie Jonas Geiping vom Ellis Institut in Tübingen und Prof. Georg Rehm vom DFKI zeigt, dass Deutschland ein wichtiger Standort für KI-Grundlagenforschung ist. Allerdings wird die oft kurzfristige und konkrete Projektfinanzierung in Deutschland im Vergleich zu langfristigen, risikoreicheren Investitionen in den USA problematisiert. Insgesamt sehen die Teilnehmer noch viel Forschungsbedarf auf dem Weg zu einer Artificial General Intelligence (AGI), wobei laut den Experten unklar ist, ob Large Language Models der richtige Ansatz sind. Meta fokussiert sich aktuell auf Multi Agents Systems.

OpenAI hat die Einführung des erweiterten Sprachmodus für ChatGPT verschoben. Statt wie geplant Ende Juni soll die Funktion nun erst im Juli für erste zahlende Nutzer verfügbar sein. Für alle Nutzer wird es den Advanced Voice Mode erst deutlich später geben, frühestens im Herbst.

Als Grund für die Verzögerung nennt OpenAI anhaltende Probleme. Man arbeite an der Verbesserung der Fähigkeit des Modells, bestimmte Inhalte zu erkennen und abzulehnen sowie an der Nutzerfreundlichkeit und Skalierbarkeit der Infrastruktur. Der erweiterte Sprachmodus soll Emotionen erkennen, nonverbale Hinweise verstehen und in Echtzeit darauf reagieren, um eine natürliche Sprachkommunikation mit dem KI-Chatbot zu ermöglichen.

Eine Kontroverse gab es um eine Stimme des Chatbots, die der Schauspielerin Scarlett Johansson ähnelte. OpenAI hatte vergeblich versucht, Johanssons Stimme zu lizensieren und entfernte die Stimme schließlich, nachdem die Schauspielerin eine Klage erwog. Unabhängig davon hat OpenAI nun die offizielle macOS-Desktop-App von ChatGPT für alle Nutzer freigegeben - allerdings noch ohne den neuen Sprachmodus.

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmmung wird hier ein externer Podcast (Podigee GmbH) geladen.

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Podigee GmbH) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Laut einem Bericht von Business Insider arbeitet Amazon intern an einem leistungsstarken KI-Chatbot namens „Metis". Das Projekt soll Amazons Antwort auf OpenAIs ChatGPT werden und in direkte Konkurrenz dazu treten.

Wie ChatGPT soll auch Metis über einen Webbrowser zugänglich sein und text- und bildbasierte Antworten liefern können. Dazu gehören auch Links zu den Quellen der Antworten, Vorschläge für Folgefragen sowie die Generierung von Bildern.

Metis nutzt das interne KI-Modell Olympus, über das bisher nicht viel bekannt ist. Zudem setzt Amazon auf Retrieval-Augmented Generation, um über die ursprünglichen Trainingsdaten hinaus auf aktuelle Informationen zugreifen zu können, etwa die neuesten Aktienkurse.

Das KI-System soll auch als Agent fungieren und komplexe Aufgaben automatisieren können, zum Beispiel einen Urlaub planen, das Licht einschalten oder einen Flug buchen. Dafür greift Metis auf Technologien einer neuen Version von Alexa zurück, die intern „Remarkable Alexa" heißt.

Der vorläufige Starttermin für Metis soll im September liegen, parallel zu einer großen Alexa-Veranstaltung.

Podcast: KI-Update

Wie intelligent ist Künstliche Intelligenz eigentlich? Welche Folgen hat generative KI für unsere Arbeit, unsere Freizeit und die Gesellschaft? Im "KI-Update" von Heise bringen wir Euch gemeinsam mit The Decoder werktäglich Updates zu den wichtigsten KI-Entwicklungen. Freitags beleuchten wir mit Experten die unterschiedlichen Aspekte der KI-Revolution.

Microsoft geht davon aus, dass KI-Modelle schon bald weitgehend autonom handeln können. Laut Mustafa Suleyman, CEO of AI des Unternehmens, ist das in den nächsten zwei Jahren allerdings nur in eng umgrenzten Anwendungsfällen möglich.

Für konstant präzise Ergebnisse in immer neuen Anwendungen braucht es seiner Meinung nach jedoch noch zwei weitere Modellgenerationen und bis zu 100 Mal mehr Rechenleistung. Die derzeitige Genauigkeit von 80 Prozent reiche dafür nicht aus, erforderlich seien 99 Prozent, um einen Vertrauensverlust beim Nutzer zu vermeiden.

Als Maßstab für zuverlässig handelnde KI-Modelle nennt Suleyman GPT-6, den mutmaßlich übernächsten Meilenstein von OpenAI nach GPT-4 und 5. Bis dahin verlagere sich der Erfolgsfaktor von der Modellgröße hin zu qualitativ hochwertigen Trainingsdaten. Gerade für Start-ups ergäben sich hier Chancen, mit relativ kleinen, aber gut trainierten Modellen erfolgreich zu sein.

Eine Analyse von Forschern der Universitäten Tübingen und Northwestern zeigt, dass mindestens 10 Prozent der 14 Millionen untersuchten wissenschaftlichen Abstracts auf PubMed seit der Einführung von ChatGPT von KI-Textgeneratoren beeinflusst wurden. In einigen Disziplinen und Ländern ist der Anteil sogar deutlich höher.

Die Wissenschaftler identifizierten bestimmte Marker-Wörter wie "delve", "intricate", "showcasing" oder "underscores", die für den blumigen Schreibstil von ChatGPT typisch sind und 2024 im Vergleich zu den Vorjahren deutlich häufiger vorkamen.

In China und Südkorea wurden rund 15 Prozent der Abstracts mit ChatGPT erstellt, in Großbritannien nur 3 Prozent. Besonders hoch war die gemessene KI-Nutzung in IT-Fachzeitschriften mit 20 Prozent, bei chinesischen Autoren sogar 35 Prozent. Die tatsächliche Nutzung dürfte aber noch höher liegen, da viele Forschende KI-generierte Texte überarbeiten.

Der Einsatz von KI könnte Autoren unterstützen und Artikel lesbarer machen. Allerdings gibt es auch Bedenken wegen erfundener Fakten, Vorurteilen und Plagiatsrisiken. Die Forscher plädieren daher für eine Neubewertung der Richtlinien für KI-Textgeneratoren in der Wissenschaft.

()