KI-Update kompakt: Google Gemini, Microsoft, Taylor Swift, Roblox

Das "KI-Update" liefert werktäglich eine Zusammenfassung der wichtigsten KI-Entwicklungen.

In Pocket speichern vorlesen Druckansicht

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmmung wird hier ein externer Podcast (Podigee GmbH) geladen.

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Podigee GmbH) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Lesezeit: 6 Min.
Von
Inhaltsverzeichnis

Google benennt seinen Chatbot Bard ab dem 7. Februar 2024 in Gemini um und führt eine übersichtlichere Chat-Oberfläche ein. Der Schritt wurde durch einen geleakten Changelog bestätigt. Android-Nutzer können sich auf eine Gemini-App freuen, die möglicherweise den Google Assistant ersetzen könnte. Allerdings wird die App zunächst nicht in Großbritannien, der Schweiz und den Ländern des Europäischen Wirtschaftsraums sowie den dazugehörigen Gebieten verfügbar sein. iOS-Nutzer können Gemini in der Google-App nutzen.

Der überraschende Erfolg von ChatGPT hat Google zu internen Veränderungen veranlasst, darunter die Zusammenlegung des Google Brain Teams und des bisher relativ unabhängigen DeepMind zu Google DeepMind, das sich auf Gemini konzentrierte. Die Gemini-App, die laut Leak auch mit Gmail, Google Maps und YouTube verknüpft ist, könnte langfristig den Google Assistant ersetzen und Google mit generativer KI eine leistungsfähigere Alternative bieten. Zudem kann Google seinen Vorteil der breiten Hardware-Basis mit nativer Integration ausspielen.

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmmung wird hier ein externer Podcast (Podigee GmbH) geladen.

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Podigee GmbH) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Microsoft arbeitet mit Nachrichtenorganisationen zusammen, um generative künstliche Intelligenz in Redaktionen zu integrieren und Journalisten bei der Recherche, Quellensuche und Übersetzung zu unterstützen. Die Zusammenarbeit soll Journalisten unterstützen, nicht ersetzen, und sei Teil von Microsofts Engagement für nachhaltigen Journalismus und Demokratieförderung. Erste Beispiele sind seine Zusammenarbeit mit Semafor und die Gründung des AI Journalism Lab. Die Online News Association startet zudem die AI in Journalism Initiative und das GroundTruth Project richtet einen KI-Tracker für seine Mitglieder ein.

Das interessanteste Projekt ist Semafor Signals, eine Art Nachrichten-Such-GPT. Es verwendet den Bing-Algorithmus für die Nachrichtensuche, übersetzt die Eingabeaufforderung in verschiedene Sprachen und durchsucht lokale, fremdsprachige und seltene Quellen.

Microsoft wurde in der Vergangenheit für den Einsatz von generativer KI auf der eigenen Plattform MSN.com kritisiert, da automatisch generierte Nachrichten falsche Informationen verbreiteten. Die Zusammenarbeit mit Nachrichtenorganisationen könnte dazu beitragen, solche Probleme in Zukunft zu vermeiden und die Qualität von KI-generierten Inhalten zu verbessern.

In den letzten Wochen sind in den sozialen Medien pornografische Deepfakes der Sängerin Taylor Swift aufgetaucht. Untersuchungen von Graphika, einem Unternehmen für Social-Media-Analysen, zeigen, dass diese Bilder auf einen Online-Wettbewerb von 4chan-Nutzern zurückzuführen sind. Ziel des Wettbewerbs war es, Sicherheitsmechanismen zu umgehen, die explizite Inhalte in KI-Bildgeneratoren blockieren. Die Nutzer des 4chan-Forums arbeiteten wochenlang daran, Prompts zu finden, um die Filter von Bildgenerierungsdiensten wie Microsoft Designer und OpenAI's DALL-E zu umgehen.

OpenAI bestreitet, dass eines der Bilder von Taylor Swift mit DALL-E erstellt wurde, während Microsoft noch untersucht, ob Bing Image Creator oder Microsoft Designer verwendet wurde. Cristina López G., Analystin bei Graphika, betont, dass die Hersteller von KI-Software die Verantwortung für solche Bilder übernehmen sollten, indem sie die Taktiken von Online-Communitys beobachten, um herauszufinden, wie diese Schutzmaßnahmen umgehen. In den USA gibt es Bestrebungen, die Verbreitung von KI-generierten, nicht einvernehmlichen intimen Bildern mit bis zu zwei Jahren Gefängnis zu bestrafen.

Das Meta Oversight Board bestätigte eine Entscheidung, ein Video von US-Präsident Joe Biden, in dem er seiner Enkelin einen Sticker auf die Brust klebt, auf der Plattform zu belassen. Das Video sei nicht manipuliert, wie es die "Manipulated Media Policy" vorschreibe. Das Board kritisiert jedoch, dass die Richtlinien von Meta unzureichend seien und nur auf manipulierte Medieninhalte abzielen, ohne die mögliche Wirkung solcher Bilder zu berücksichtigen.

Das Board fordert Meta auf, die Richtlinien schnellstmöglich zu überarbeiten, insbesondere im Hinblick auf die bevorstehenden Wahlen. Derzeit konzentrieren sich die Richtlinien nur auf Videos und Bilder, das Board empfiehlt jedoch, auch Audioinhalte einzubeziehen und neben Deepfakes auch sogenannte "Cheapfakes" zu verbieten, bei denen Veränderungen oder Ausschnitte von Medien in einen anderen Kontext gestellt werden.

Das KI-Start-up Midjourney hat Ahmad Abbas, den ehemaligen Hardware Engineering Manager von Apple Vision Pro, als Head of Hardware eingestellt. Abbas hat nicht nur an der Vision Pro gearbeitet, sondern war davor auch bei Elon Musks Gehirnchip-Start-up Neuralink. Midjourney-Gründer David Holz und Abbas kennen sich bereits aus ihrer gemeinsamen Zeit bei Leap Motion.

Holz erwähnte ein Hardware-Projekt Anfang Januar 2024 in Discord-Gesprächen mit Midjourney-Nutzern und beschrieb es als ein Gerät, das Tausende von 3D-Räumen erzeugen und verwalten kann. Später bestätigte er auf X die Arbeit am "Orb". Das Hardware-Team konzentriere sich derzeit auf die Erfassung von 3D-Daten, die für das KI-Training benötigt würden.

Holz bezeichnete sein Bildmodell Midjourney bereits früher als "sehr langsame Spiele-Engine" und versprach für die Zukunft volumetrische 3D-Welten, die mit 60 Bildern pro Sekunde generiert werden. Er prognostizierte, dass es in zehn Jahren eine Spielkonsole mit KI-Prozessor geben werde, die Spiele in Echtzeit generiert.

Die Online-Spieleplattform Roblox kündigt ein KI-basiertes Übersetzungssystem mit einer Milliarde Parametern an, um Sprachbarrieren zwischen bis zu sechs Millionen gleichzeitig aktiven Spielern zu überwinden. Laut Roblox-CTO Daniel Sturman kann das Modell in Echtzeit zwischen 16 unterstützten Sprachen übersetzen, darunter Deutsch, Englisch und Japanisch. Ziel ist es, eine nahtlose Interaktion zwischen Spielern aus verschiedenen Sprachräumen zu ermöglichen.

Anstatt 256 separate Modelle für jedes Sprachpaar (16 x 16) zu entwickeln, setzt Roblox auf ein einheitliches, transformationsbasiertes Übersetzungsmodell, das alle Sprachpaare in einem einzigen Modell vereint.

Spieler können Feedback zu fehlerhaften Übersetzungen geben und bessere Übersetzungen vorschlagen, die dann in die Trainingsdaten einfließen. Das Sprachmodell soll auch modernen Slang verstehen, indem "populäre und trendige Begriffe für jede Sprache" übersetzt und in die Trainingsdaten aufgenommen werden.

Podcast: KI-Update

Wie intelligent ist Künstliche Intelligenz eigentlich? Welche Folgen hat generative KI für unsere Arbeit, unsere Freizeit und die Gesellschaft? Im "KI-Update" von Heise bringen wir Euch gemeinsam mit The Decoder werktäglich Updates zu den wichtigsten KI-Entwicklungen. Freitags beleuchten wir mit Experten die unterschiedlichen Aspekte der KI-Revolution.

(igr)