KI-Update kompakt: Ignite, Lernprozess von KI, Pflanzen-Robo, Amazons Rufus

Das "KI-Update" liefert werktäglich eine Zusammenfassung der wichtigsten KI-Entwicklungen.

In Pocket speichern vorlesen Druckansicht

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmung wird hier ein externer Podcast (Podigee GmbH) geladen.

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Podigee GmbH) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Lesezeit: 7 Min.
Von
Inhaltsverzeichnis

Microsoft führt neue KI-Agenten ein, die als "neue Apps" verschiedene Arbeitsaufgaben übernehmen sollen. Diese Agenten können Kundenanfragen beantworten, Fehler in der Lieferkette finden oder Lieferzettel ausfüllen. Sie stehen als vorgefertigte Versionen in Microsoft 365 und Dynamics 365 zur Verfügung und können im Copilot Studio auch ohne Programmierkenntnisse erstellt werden.

Zu den neuen Agenten gehören Sharepoint-Agenten für Inhaltsverarbeitung, Self-Service Agents im BizChat für Mitarbeiterfragen, ein Moderatoren-Agent für effektivere Meetings und ein Projektmanager-Agent für Projektplanung. Besonders hervorzuheben ist der Interpreter-Agent, der in neun Sprachen Echtzeitübersetzungen anbietet und sogar die Stimme des Nutzers verwenden kann. Eine zentrale Agenten-Bibliothek im Copilot Studio soll den Überblick bewahren.

Googles KI-Chatbot Gemini hat eine Erinnerungsfunktion bekommen. Im Gedächtnis dieser Künstlichen Intelligenz können Daten und Vorlieben der Nutzerinnen und Nutzer gespeichert werden, sodass Antworten persönlicher wirken und individuell zugeschnitten sind. Vor mehr als einem Jahr hatte Google bereits angekündigt, dem damals noch Bard genannten KI-Chatbot eine solche Funktion spendieren zu wollen. Bislang konnte sich Gemini allerdings keine Gesprächsinhalte merken, nur Informationen etwa zur Sprache, dem Gerät und dem Standort. Das ändert sich nun, sodass Google jetzt der Konkurrenz nachzieht. Denn bereits Anfang des Jahres hatte OpenAI Memory für ChatGPT eingeführt. Gemini kann sich etwa daran erinnern, welche Vorlieben ich beim Abendessen habe, sodass Antworten auf Restaurantempfehlungen auch Wochen später darauf zugeschnitten sein sollten. Was sich der KI-Chatbot merken soll, lässt sich explizit angeben, etwa mit Phrasen wie "Vergiss nicht" oder "Ich kann nur" oder "Nenne immer".

Die Funktion wirft allerdings auch Fragen auf, etwa zum Datenschutz. Wahrscheinlich auch deswegen kann die Funktion laut Google abgeschaltet und Erinnerungen einzeln gelöscht werden. Allerdings ist die Erinnerungsfunktion bislang nur in englischer Sprache verfügbar und auch nur im Browser. Die mobilen Gemini-Apps für Android und iOS haben noch kein Gedächtnis. Zudem beherrscht ausschließlich "Gemini Advanced" diese Funktion, es wird also ein "Google One AI Premium-Abo" vorausgesetzt.

Eine neue Forschungsmethode untersucht KI-Systeme in einem "Konzeptraum" und zeigt, dass sie über mehr Fähigkeiten verfügen als bisher durch einfache Prompts zugänglich war. Die Studie demonstriert, wie Modelle verschiedene Konzepte wie Farbe oder Form mit unterschiedlicher Geschwindigkeit lernen, abhängig von der Signalstärke in den Trainingsdaten.

Die Forscher entdeckten, dass KI-Modelle durch spezielle Techniken wie "latente Interventionen" oder "Overprompting" versteckte Fähigkeiten aktivieren können, die mit normalen Prompts nicht abrufbar sind. Diese Erkenntnisse wurden sowohl an synthetischen Daten als auch an realen Datensätzen wie CelebA und Stable Diffusion 1.4 bestätigt, wo die Modelle ungewöhnliche Bildkombinationen erzeugen konnten, die sie mit normalen Prompts nicht produzieren würden.

Das KI-Musik-Start-up Suno hat die Version 4 seines KI-Musikgenerators für zahlende Nutzer als Beta veröffentlicht. Das Update bringt Verbesserungen bei Audioqualität, Songtexten und Songstrukturen. Zu den neuen Funktionen gehören ein "Remaster"-Tool zur Aufwertung älterer Songs auf Version 4-Qualität, der Lyrics-Assistent "ReMi" zur Unterstützung beim Texten sowie kreativere Cover-Art-Designs.

Auch bestehende Funktionen wie "Covers" zum Neuinterpretieren eigener Audiodateien und "Personas" zum Speichern von Stilen wurden aktualisiert. Die ersten Nutzer-Reaktionen fallen gemischt aus: Klarere Songtexte werden gelobt, technische Probleme mit Becken/Hall sowie Schwächen bei "Remaster" und "Personas" kritisiert. Insgesamt zeigt die Beta noch einige Kinderkrankheiten.

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmung wird hier ein externer Podcast (Podigee GmbH) geladen.

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Podigee GmbH) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Die KI-Organisation LAION hat mit DISCO-12M den bislang größten öffentlich verfügbaren Musikdatensatz für das Training von Audio-KI-Modellen veröffentlicht. Er enthält 12 Millionen Links zu YouTube-Musikstücken mit zugehörigen Metadaten.

Im Vergleich zum Vorgänger bietet der Satz eine verbesserte Datenqualität durch die direkte Erfassung von YouTube Music ohne Umweg über Spotify. Auch die Anzahl der erfassten Künstlerinnen und Künstler wurde auf über 250.000 erhöht. LAION setzt sich für offene KI-Entwicklung ein, steht aber auch in der Kritik, da seine Datensätze teils auf geschütztes Material verweisen. Der neue Datensatz ist nur für die akademische Forschung bestimmt, von kommerzieller Nutzung wird abgeraten.

Podcast: KI-Update

Wie intelligent ist Künstliche Intelligenz eigentlich? Welche Folgen hat generative KI für unsere Arbeit, unsere Freizeit und die Gesellschaft? Im "KI-Update" von Heise bringen wir Euch gemeinsam mit The Decoder werktäglich Updates zu den wichtigsten KI-Entwicklungen. Freitags beleuchten wir mit Experten die unterschiedlichen Aspekte der KI-Revolution.

Chinesische Forscher haben einen innovativen Roboter entwickelt, der Pflanzen durch Berührung ihrer Blätter identifizieren kann. Mit einer speziellen Elektrode misst der Roboter verschiedene Eigenschaften wie gespeicherte Ladung, elektrische Leitfähigkeit und Kontaktkraft. Die gesammelten Daten werden mittels KI ausgewertet, wodurch der Roboter zehn verschiedene Pflanzenarten mit einer Genauigkeit von 97,7 Prozent erkennen kann.

Das System soll vor allem in der Landwirtschaft zum Einsatz kommen, um Wachstum zu überwachen und Entscheidungen über Bewässerung und Düngung zu treffen. Im Vergleich zu visuellen Erkennungssystemen bietet diese Methode den Vorteil, weniger anfällig für Umwelteinflüsse wie Lichtverhältnisse oder Wetter zu sein. Die Forscher arbeiten an Verbesserungen, um mehr Pflanzenarten erkennen zu können und Echtzeitdaten zu liefern.

Wer als deutscher oder österreichischer Kunde des Online-Versandhändlers Amazon Fragen zu einem angebotenen Produkt hat, kann sich ab sofort an den KI-basierten Shopping-Assistenten "Rufus" wenden. Er wurde auf der Grundlage des Amazon-Produktkatalogs und Informationen aus dem Internet trainiert. Die Funktion war hierzulande bislang in einer Beta-Version nur ausgewählten Testkunden zur Verfügung gestellt worden. Nun können alle Kunden Rufus über ein Icon in der rechten unteren Ecke der offiziellen Amazon-Shopping-App aufrufen.

In einem Textchat kann man Rufus Fragen zu Produkten stellen, die über die technischen Daten hinausgehen, die Amazon üblicherweise sowieso auf seiner Website bereitstellt. Diese Fragen können sich beispielsweise auf eine Information beziehen, die in der Bedienungsanleitung zum Produkt zu finden sind. Auch für Vergleiche zwischen verschiedenen Produkten soll sich Rufus nutzen lassen. Und selbst konkrete Hilfestellung am Anfang der Kaufentscheidung wie "Was brauche ich, um Smoothies zu machen?" sollen möglich sein. Amazon erklärt aber selbst, dass die Technologie noch in den Kinderschuhen stecke. Man wolle die KI-Modelle aber immer weiter verbessern und die Antworten kontinuierlich optimieren, sodass Rufus mit der Zeit immer hilfreicher werde.

Auch Google hat ein Tool veröffentlicht, das Menschen beim Shopping unterstützen soll, allerdings in der realen Welt: das neueste Update für das KI-Bilderkennungstool Google Lens bietet Unterstützung beim Einkauf in physischen Geschäften. Android- und iOS-Nutzer in den USA können in teilnehmenden Läden ein Foto eines Produkts mit der Google-App aufnehmen. Daraufhin soll Google Lens detaillierte Produktinformationen, Kundenrezensionen, Preisvergleiche mit anderen Anbietern und ähnliche Produkte aus dem Angebot desselben Geschäfts auflisten.

Die Einkaufshilfe stützt sich auf Google Gemini und den sogenannten Google Shopping Graph, der laut Blogpost über 45 Milliarden Produkte listet. Unter den teilnehmenden Geschäften sind unter anderem Macy's, Target und Walmart – Einzelhändler, die Daten über ihre Produkte und Lagerbestände mit Google teilen. Nutzen soll man das Feature vorerst aber nur für Kosmetik, Elektronikartikel und Spielzeug – passend also zum Weihnachtseinkauf.

(igr)