KI-Update kompakt: Google Gemini, Llama 3, Qualcomm AI Hub, Musikgeneratoren

Das "KI-Update" liefert werktäglich eine Zusammenfassung der wichtigsten KI-Entwicklungen.

In Pocket speichern vorlesen Druckansicht

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmmung wird hier ein externer Podcast (Podigee GmbH) geladen.

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Podigee GmbH) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Lesezeit: 7 Min.
Inhaltsverzeichnis

Alphabet-CEO Sundar Pichai hat die Fehlleistungen von Googles KI-Chatbot und -Bildgenerator Gemini als "völlig inakzeptabel" bezeichnet und Besserung gelobt. In einer internen Mitteilung, die an die Mitarbeiter ging, reagierte er auf die Aussetzung der Gemini-Bildgenerierung, nachdem diese historisch inkorrekte Bilder hervorgebracht hatte. Unter anderem zeigte die KI Gesichter von Afroamerikanern und Asiaten in Kontexten, in denen sie historisch nicht zutreffend waren, wie bei den Gründungsvätern der USA.

Besonders konservative Kreise hatten Gemini kritisiert, nachdem die KI in Textantworten den Einfluss von Elon Musk mit dem von Adolf Hitler verglichen hatte. Pichai räumte ein, dass Gemini Nutzer beleidigt und Voreingenommenheit offenbart habe. Er betonte das Engagement Googles, die KI zu verbessern und versicherte, dass bereits Fortschritte erzielt wurden.

Zur Fehlerbehebung kündigte Pichai strukturelle Änderungen, überarbeitete Produktrichtlinien, verbesserte Einführungsprozesse und ethische Überprüfungen an. Er bekräftigte das Ziel, aus den Fehlern zu lernen und auf dem Produkt aufzubauen, unterstrich jedoch, dass die Entwicklung von KI eine hohe Herausforderung darstelle.

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmmung wird hier ein externer Podcast (Podigee GmbH) geladen.

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Podigee GmbH) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Laut The Information bereitet Meta die Einführung von Llama 3 vor, einer verbesserten Version des KI-Sprachmodells. Im Vergleich zu Llama 2 soll die neue Version besser auf Benutzer eingehen und Kontext anbieten, anstatt knifflige Fragen zu blockieren. So soll Llama 3 beispielsweise besser Wörter mit potenziell gefährlichen oder harmlosen Bedeutungen im Kontext verstehen, etwa „schlagen“.

Um solche nuancierteren Antworten zu ermöglichen, plant Meta die Einstellung eines Verantwortlichen für Ton und Sicherheitstraining. Die größte Ausführung von Llama 3 könnte mehr als 140 Milliarden Parameter haben, doppelt so viele wie Llama 2.

Obwohl die Feinabstimmung von Llama 3 noch nicht begonnen hat, plant Meta laut Quellen von The Information, das endgültige Modell im Juli zu veröffentlichen. Llama 3 könnte dann das erste offene KI-Modell sein, das die Qualität von GPT-4 erreicht.

Mistral kooperiert mit Microsoft und verkauft sein neuestes KI-Modell via API - die Ankündigung hatte vereinzelt zu Befürchtungen geführt, das Unternehmen würde künftig keine offenen Modelle mehr veröffentlichen und nicht mehr unabhängig sein.

Arthur Mensch, CEO von Mistral, erklärte nun auf X, dass sein Unternehmen dem Engagement für offene KI-Modelle treu bleibt. Trotz einer Vertriebspartnerschaft mit Microsoft, durch welche Mistrals neuestes KI-Modell über eine API verkauft wird, versicherte Mensch, Mistral arbeite weiterhin an offenen Modellen. Er bat um Geduld und verwies auf aktuell limitierte Rechenkapazitäten.

Mensch unterstrich zudem, dass Mistral ein unabhängiges europäisches Unternehmen mit globalen Ambitionen bleibt. Die Kooperation mit Microsoft beinhalte einen Reseller-Vertrag und eine kleine Wandelanleihe, die das Wachstum des europäischen Start-ups fördern soll.

Qualcomm hat eine neue Plattform namens AI Hub Models vorgestellt, die 80 KI-Modelle umfasst, die für den Einsatz auf Snapdragon-Geräten und im Android-Ökosystem optimiert sind. Die Modelle sind speziell für Bild-, Audio- und Sprachanwendungen voroptimiert und enthalten fortschrittliche Algorithmen wie Whisper, ControlNet, Stable Diffusion und Baichuan 7B.

Die effizienten Modelle unterstützen eine Vielzahl von Formfaktoren und Laufzeiten und sind kompatibel mit TensorFlow Lite und dem Qualcomm AI Engine Direct SDK. Darüber hinaus ist der Qualcomm AI Hub für Geräte verfügbar, die in der Cloud gehostet werden. Qualcomm will auch die Vernetzung und das gemeinsame Lernen durch eine AI Hub Slack Community fördern.

Die Bereitstellung von KI-Modellen, die lokal auf den Geräten ausgeführt werden, kann die Abhängigkeit von Cloud-Diensten verringern und den Datenschutz sowie die Reaktionsgeschwindigkeit verbessern. Die neue Plattform ermöglicht es Entwicklern nun, KI-Anwendungen für Snapdragon-Geräte und das Android-Ökosystem schneller bereitzustellen.

"Die Kunst, aber auch die Demokratie werden bedroht." Das meinen die deutschsprachigen Verbände der Literaturübersetzenden in Deutschland, Österreich und der Schweiz angesichts der zunehmenden "Automatisierung geistiger Arbeit und menschlicher Sprache".

In einem offenen Brief verlangen sie die Offenlegung von Funktionsweisen und Trainingsdaten generativer KI-Systeme sowie die Transparenz bezüglich der Nutzung urheberrechtlich geschützter Werke beim KI-Training. Sie fordern zudem eine angemessene Vergütung für Urheber und eine Kennzeichnungspflicht für KI-generierte Inhalte.

"Sie haben weder Gedanken noch Emotionen oder ästhetisches Empfinden, kennen keine Wahrheit, kein Weltwissen und keine Gründe für Übersetzungsentscheidungen." Sie warnen, dass KI-Produkte Vorurteile verstärken und Sprachentwicklung sowie Kreativität hemmen könnten.

Heise-Redakteur Marvin Strathmann hat drei kostenlose Musik-KI-Tools auf ihr Potenzial, Hits zu kreieren, untersucht. Die Tools – Suno, Soundraw und Stable Audio – nutzen Prompts oder einfache Befehle, um musikalische Kompositionen zu erstellen. Während alle drei interessante Ergebnisse lieferten, variierte die Qualität der Kompositionen. Im Gegensatz zu Soundraw und Stable Audio bietet Suno die Möglichkeit, Gesang zu generieren. Ob diese Funktion überzeugt, lässt sich im begleitenden Video beurteilen.

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmmung wird hier ein externes YouTube-Video (Google Ireland Limited) geladen.

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Google Ireland Limited) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Das Kölner Start-up Mentafy stellte auf der Didacta ein Tool zur Kontrolle wissenschaftlicher Arbeiten vor. Mentafy richtet sich mit seinem Angebot sowohl an Schulen als auch an Universitäten und andere Bildungseinrichtungen, die schriftliche Arbeiten im Umfang von derzeit 30 bis 40 Seiten als Leistungsnachweis verlangen. Damit das Programm seine ganze Kraft entfalten kann, müssen sowohl die Bildungseinrichtungen als auch die Prüflinge mit dem Verfahren einverstanden sein - denn Mentafy protokolliert bei bestimmungsgemäßem Einsatz die einzelnen Arbeitsschritte, unterstützt aber auch mit eigenen KI-Tools bei der Arbeit. So wird genau sichtbar, was von wem, wann und in welcher Form in die Arbeit eingeflossen ist.

Wenn Prüflinge auf Probleme stoßen und auch die Tipps der KI nicht weiterhelfen, können Lehrkräfte eingreifen und auf die Sprünge helfen. Wenn Prüflinge nicht möchten, dass jeder ihrer Arbeitsschritte genau dokumentiert wird, können sie dies auch ablehnen. Die Lehrenden können dann nur auf statistisch zusammengefasste Informationen über eine Arbeit zurückgreifen, die dennoch die Plausibilität der Arbeitsweise erkennen lassen sollen, so CEO Markus Goldbach.

Allerdings kann Mentafy noch keine Plagiate erkennen, dafür ist noch externe Software notwendig. Zudem kann die Protokollfunktion für Kandidaten problematisch sein, wenn Ideen außerhalb des Systems entwickelt und später eingefügt werden

Podcast: KI-Update

Wie intelligent ist Künstliche Intelligenz eigentlich? Welche Folgen hat generative KI für unsere Arbeit, unsere Freizeit und die Gesellschaft? Im "KI-Update" von Heise bringen wir Euch gemeinsam mit The Decoder werktäglich Updates zu den wichtigsten KI-Entwicklungen. Freitags beleuchten wir mit Experten die unterschiedlichen Aspekte der KI-Revolution.

(igr)