KI-Update kompakt: Google Gemini, Trainingsmethode DisTrO, Claude, Meta Sapiens

Das "KI-Update" liefert werktäglich eine Zusammenfassung der wichtigsten KI-Entwicklungen.

In Pocket speichern vorlesen Druckansicht

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmmung wird hier ein externer Podcast (Podigee GmbH) geladen.

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Podigee GmbH) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Lesezeit: 5 Min.
Von
Inhaltsverzeichnis

Google hat zwei neue Funktionen für seinen KI-Assistenten Gemini angekündigt: "Gems" und den KI-Bildgenerator "Imagen". Gems sind benutzerdefinierte Versionen von Gemini, die als Experten für bestimmte Themen dienen können. Sie speichern frühere Konversationen und Informationen, um wie Experten in einem bestimmten Bereich zu fungieren. Google stellt verschiedene vorgefertigte Gems zu Themen wie Lernhilfe, kreative Partnerschaft und Karriereberatung bereit.

Der KI-Bildgenerator Imagen 3 kann wieder Bilder von Personen erstellen, allerdings mit Einschränkungen. Es sollen keine fotorealistischen Bilder bekannter oder minderjähriger Personen sowie exzessive Gewaltdarstellungen oder sexuelle Inhalte generiert werden können. Die Bilder werden mit Wasserzeichen versehen, um sie als KI-generiert zu kennzeichnen. Während der Bildgenerator in allen Gemini-Apps verfügbar sein wird, sind die Gems und die Erstellung von Personenbildern auf die kostenpflichtigen Versionen von Gemini beschränkt.

Eine neue Optimierungsmethode namens DisTrO reduziert die Kommunikation zwischen GPUs während des KI-Trainings um das bis zu 10.000-fache. Beim Pre-Training eines 1,2 Milliarden Parameter großen Sprachmodells sank die erforderliche Bandbreite pro Trainingsschritt von 74 GB auf nur noch 86 MB. Beim Fine-Tuning sind laut den Forschern sogar Reduktionen um das bis zu 10.000-fache möglich.

Dies könnte das Training großer KI-Modelle demokratisieren, da es auch mit normalen Internetverbindungen möglich wäre, ohne auf spezialisierte Hochgeschwindigkeitsverbindungen angewiesen zu sein. Die Forscher sehen zudem Potenzial für ein dezentrales Netzwerk zur gemeinsamen Ressourcennutzung sowie für Anwendungen wie Federated Learning, bei denen Modelle kollaborativ trainiert werden, die Trainingsdaten aber privat und dezentral bleiben.

Zum ersten Mal in der Firmengeschichte hat Nvidia in einem einzelnen Quartal 30 Milliarden US-Dollar umgesetzt. Ebenso stellen der Betriebsgewinn von 18,6 Milliarden Dollar und der Nettogewinn von 16,6 Milliarden Dollar Rekorde dar.

Besonders imposant sind die Vergleiche zum Vorjahr, weil damals der KI-Hype gerade erst begann – dieser ist für das rasante Wachstum verantwortlich, weil Nvidia Hauptlieferant für Beschleuniger fürs KI-Training ist. Im Jahresvergleich steigt der Umsatz um 122 Prozent, der Betriebsgewinn um 174 Prozent, der Nettogewinn um 168 Prozent.

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmmung wird hier ein externer Podcast (Podigee GmbH) geladen.

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Podigee GmbH) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Nutzer:innen berichten erneut über eine anscheinend nachlassende Leistung von Anthropics Chatbot Claude.

Die Kritik an der angeblich nachlassenden Leistung wird auf Reddit heiß diskutiert. Ein Nutzer beklagt, dass der Bot nach zwei Sätzen sein Ziel vergesse und selbst einfache Programmieraufgaben nicht mehr bewältigen könne.

Anthropic widerspricht den Behauptungen und erklärt, dass keine Änderungen an den Modellen vorgenommen wurden. Das Unternehmen hat jedoch damit begonnen, die aktuellen Systemprompts, also die Anweisungen an das Modell, die das Unternehmen selbst vor den Prompts der Nutzerinnen und Nutzer an das Modell gibt, für mehr Transparenz zu dokumentieren. Möglicherweise haben auch technische Probleme bei Googles KI-Plattform Vertex AI eine Rolle gespielt. Diese hatte Anfang August Ausfälle zu verzeichnen.

Es scheint ein wiederkehrendes Muster zu sein, dass Nutzerinnen und Nutzer einige Zeit nach der Veröffentlichung eines Modells über Leistungseinbußen klagen und die Hersteller dies dementieren. Ein Grund dafür könnte sein, dass die Erwartungen der Nutzenden mit der Zeit steigen, während die Modelle nicht in gleichem Maße mitwachsen.

Podcast: KI-Update

Wie intelligent ist Künstliche Intelligenz eigentlich? Welche Folgen hat generative KI für unsere Arbeit, unsere Freizeit und die Gesellschaft? Im "KI-Update" von Heise bringen wir Euch gemeinsam mit The Decoder werktäglich Updates zu den wichtigsten KI-Entwicklungen. Freitags beleuchten wir mit Experten die unterschiedlichen Aspekte der KI-Revolution.

Meta hat eine neue Familie von KI-Modellen namens "Sapiens" vorgestellt, die sich auf die Analyse von Bildern mit Menschen spezialisieren. Die Modelle wurden mit 300 Millionen menschlichen Bildern vortrainiert und können Aufgaben wie 2D-Posenschätzung und Körpersegmentierung ausführen.

Das größte Modell, Sapiens-2B, verfügt über 2 Milliarden Parameter und wurde mit einer HD-Bildauflösung trainiert. Bei der Körpersegmentierung erzielt es eine Verbesserung von mehr als 17 Prozentpunkten gegenüber früheren Methoden. Laut den Forschenden könnte Sapiens als Werkzeug dienen, um große Mengen realer Daten zu annotieren und so die nächste Generation menschenzentrierter Bildanalysesysteme zu entwickeln. Meta stellt die Modelle der Forschungsgemeinschaft auf GitHub zur Verfügung.

Jugendschutz.net, das gemeinsame Kompetenzzentrum von Bund und Ländern, hat in seinem Jahresbericht auf zunehmende Probleme im Bereich des Jugendschutzes im Internet hingewiesen. Die Organisation bearbeitete 45.963 Meldungen, wobei 7645 Verstöße gegen Rechtsvorschriften festgestellt wurden. Zwei Drittel der Fälle betrafen sexualisierte Gewalt, gefolgt von Pornografie, politischem Extremismus und selbstgefährdenden Inhalten.

Ein wachsendes Problem stellen jugendliche Täter dar, die unter den Strafgesetzbuch-Paragrafen 184b fallende Inhalte austauschen. Zudem werden zunehmend Inhalte gefunden, die über Videochats mit Minderjährigen entstehen, was auf Cybergrooming hindeutet. Die Verbreitung von Extremismus und Hassinhalten, insbesondere nach dem Hamas-Überfall auf Israel, wurde ebenfalls als problematisch identifiziert. KI wird verstärkt für die Erstellung und Modifikation von Propaganda eingesetzt, was die Erkennung erschwert.

(igr)