KI-Update kompakt: Nvidias Blackwell & Edify, KI-Chatbot Scamio, Koch-Roboter

Das "KI-Update" liefert werktäglich eine Zusammenfassung der wichtigsten KI-Entwicklungen.

In Pocket speichern vorlesen Druckansicht

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmmung wird hier ein externer Podcast (Podigee GmbH) geladen.

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Podigee GmbH) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Lesezeit: 12 Min.
Inhaltsverzeichnis

Nvidia hat zur Entwicklerkonferenz GTC nach San José in Kalifornien eingeladen, um dort die neuesten KI-Chips des Hauses vorzustellen. Carsten Spille von der c’t ist vor Ort und berichtet über die neue Blackwell-Architektur, mit der Nvidia die Konkurrenz auf Abstand halten will. Auf dem Papier sind die Blackwell-Chips um rund Faktor 2 schneller als AMDs Instinct MI300X und schließen vor allem die Lücke bei der Speichergröße, die zuletzt offensichtlich geworden war.

Und obwohl sich in der Industrie manche bereits zuvor über hohe Preise und lange Lieferzeiten beschwerten, sind alle namhaften Größen von AWS über Microsoft Azure und die Oracle Cloud direkt zum Start später im Jahr mit dabei, zu groß ist einerseits die Sorge, hier etwas zu verpassen. Andererseits ist das Software-Ökosystem rund um Nvidias CUDA mit hunderten von APIs, Bibliotheken & Co. einfach der De-Facto-Standard – auch geschuldet dem frühen Start, den Nvidia damit hinlegte. Das ist die Nuss, die die Konkurrenz von AMD, Intel und zig Start-ups erst einmal knacken muss, bis sie mit alternativen Chipangeboten mehr als nur Achtungserfolge erzielen kann – immerhin haben sie das erkannt und arbeiten daran. Solange der KI-Hype noch voll im Gange ist, wird wohl jede der Firmen so viele Chips verkaufen, wie sie liefern kann.

Auf der GTC hat Nvidia auch Neuigkeiten im Bereich Software vorgestellt: Konkret geht es um Kooperationen im Bereich der visuellen generativen KI. Der Chip-Hersteller arbeitet mit Shutterstock, Getty Images, Adobe und weiteren zusammen, die dann das Nvidia-eigene KI-Modell Edify anbieten. Zunächst gibt es einen Early-Access zu Shutterstocks 3D-Generator via API. Damit sollen Entwicklerinnen und Creator virtuelle Szenen in 3D per Text-Prompt erstellen können. So ließe sich beispielsweise ein Filmset, eine Theaterbühne oder Ähnliches blitzschnell erdenken. Das Tool ist entsprechend für den professionellen Einsatz entwickelt worden und kein spaßiger Bildgenerator, wie etwa Midjourney.

Eine weitere Kooperation gehen Nvidia, Shutterstock und HP ein. Die 3D-Modelle lassen sich dadurch mit den HP-3D-Druckern erstellen. Die nötigen Zwischenschritte sollen automatisiert werden. Shutterstocks Bildgenerator ist ausschließlich auf lizenziertem Material trainiert worden.

Gleiches gilt für Adobes Firefly. Auch dieser Bildgenerator soll künftig 3D-Modelle erstellen können. Getty Images arbeitet ebenfalls mit Nvidia und nutzt Edify. Nachdem bereits im Januar die APIs für sogenanntes Inpainting und Outpainting angekündigt wurden, sind sie ab sofort verfügbar. Damit gemeint ist, dass man generierte Bilder weiter bearbeiten kann, indem Objekte hinzugefügt oder herausgenommen werden. Geplant ist beispielsweise auch eine Sketch-Funktion, bei der man mittels einer Skizze die KI anleiten kann, etwas zu generieren. Zudem gibt es ab Mai die Möglichkeit für Unternehmen oder Organisationen, ein vortrainiertes KI-Modell im Sinne des eigenen Brands – also des eigenen visuellen Stils – mittels Finetunings weiter anzupassen.

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmmung wird hier ein externer Podcast (Podigee GmbH) geladen.

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Podigee GmbH) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Microsoft baut im nordrhein-westfälischen Industriegebiet der Gemeinden Bedburg, Bergheim und Elsdorf milliardenschwere Rechenzentren. Begleitend soll den Anwohnerinnen und Anwohnern eine "KI-Qualifizierungsoffensive" zugutekommen. Das Programm umfasst mehrere Punkte, darunter Kooperationen mit Schulen, Universitäten und Betrieben. So will Microsoft bis Ende 2025 etwa 100.000 junge Menschen in NRW erreichen. Zu Schulen, Ausbildungsstätten und Berufskollegs fährt ein "KI-Mobil", das den Diskurs rund um Künstliche Intelligenz anregen soll.

Konkreter wird es bei der "Datacenter Academy", die Partnerschaften zwischen Industrie und Bildungsträgern aufbauen soll. In deren Rahmen soll es Trainingspläne, Stipendien für die Teilnehmenden, Simulationslabore, Mentoring und Berufspraktika geben. Lokalausgaben von "SkillHer" sollen Frauen und queere Menschen in der IT fördern, die in der Branche bislang noch unterrepräsentiert sind.

OpenAI plant, dieses Jahr ein "erstaunliches neues Modell" auf den Markt zu bringen. Im Lex Fridman Podcast sprach OpenAI CEO Sam Altman über das geplante Modell, dessen endgültiger Name aber noch nicht feststeht. Möglicherweise handelt es sich dabei um das kürzlich durchgesickerte GPT-4.5. Vor der Veröffentlichung will OpenAI "viele neue Dinge" präsentieren, damit könnte das für dieses Jahr bereits angekündigte Video-Modell Sora gemeint sein.

Altman äußert sich nicht konkret zum als KI-Durchbruch gehypten Projekt "Q*". Er sagte jedoch, dieses Projekt stehe im Zusammenhang mit Logik, also der Fähigkeit der KI, korrekte Schlussfolgerungen zu ziehen. Dieses Problem sei weiterhin ungelöst. Altman kritisierte in dem Interview auch GPT-4 Turbo und GPT-4 als "eher schlecht" und deutet an, dass der Sprung von GPT-4 auf GPT-5 ähnlich groß sein könnte wie von GPT-3 auf GPT-4. Die Ankündigung eines neuen KI-Modells von OpenAI weckt natürlich hohe Erwartungen in der Branche und könnte die Entwicklung von KI-Anwendungen weiter vorantreiben. Die Frage ist, wie viel besser ein neues GPT sein kann als das aktuelle Modell GPT-4. Bislang konnte nur Claude 3 Opus in der Praxis zum aktuellen Top-Modell von OpenAI aufschließen – beziehungsweise es sogar schlagen.

Podcast: KI-Update

Wie intelligent ist Künstliche Intelligenz eigentlich? Welche Folgen hat generative KI für unsere Arbeit, unsere Freizeit und die Gesellschaft? Im "KI-Update" von Heise bringen wir Euch gemeinsam mit The Decoder werktäglich Updates zu den wichtigsten KI-Entwicklungen. Freitags beleuchten wir mit Experten die unterschiedlichen Aspekte der KI-Revolution.

Bitdefender hat einen KI-Chatbot entwickelt, der Internetnutzerinnen und -nutzern bei der Bewertung von Nachrichten erkennen helfen soll, ob diese bösartige Betrugsnachrichten oder echte Informationen enthalten. Der Scamio getaufte KI-Chatbot unterstützt nun auch die deutsche Sprache und kann diverse Formate untersuchen, erklärt Dirk Knop von heise online.

Nach einer Registrierung mit E-Mail und Passwort auf der Scamio-Webseite von Bitdefender lässt sich der Chatbot kostenlos nutzen. Er steht als Anwendung im Browser zur Verfügung, oder kann mittels Facebook Messenger angesprochen werden. Eine WhatsApp-Anbindung ist in Vorbereitung und soll "in Kürze" zur Verfügung stehen. Der KI-Chatbot versteht dabei diverse Formate und kann diese auf Betrugsversuche abklopfen. Dazu können Nutzerinnen und Nutzer ein Bild oder Screenshot schicken, einen Link in den Dialog einwerfen oder einfach den Text einer Nachricht oder Mail kopieren und einfügen.

Bei einem anekdotischen Test mit einer jungen Phishing-Mail antwortete Scamio passend: "Die Analyse hat ergeben, dass die von Ihnen bereitgestellte Nachricht sehr ähnlich zu Inhalten ist, die man in Spam-E-Mails findet. Wenn Sie mit Spam-E-Mails oder anderen unerwünschten Nachrichten konfrontiert werden, vermeiden Sie es bitte, auf Links zu klicken oder persönliche oder finanzielle Informationen preiszugeben."

Derzeit befinde sich Scamio in einer "Early-Access-Phase", erläutert Bitdefender auf der zugehörigen Webseite. Durch die häufigere Nutzung soll der Chatbot weiter dazulernen und bessere Erkennungen liefern. Auch wenn das für manche skurril anmutet, kann so ein KI-Chatbot doch eine echte Hilfestellung für die Menschen liefern, die sich bei einer Nachricht unsicher sind. Um eine zweite Meinung einzuholen, taugt der Scamio-Chatbot auf jeden Fall. Ein Blick auf die Kriminalitätsstatistik für den Online-Bereich etwa in Niedersachsen zeigt, dass durch solche Betrugsmaschen immer noch zehntausende Fälle pro Jahr auftreten. Davon lassen sich sicherlich einige mit der Scamio-Prüfung vermeiden.

Apple führt Gespräche mit Google über eine mögliche Partnerschaft. Dabei sollen Apples iPhone-Softwarefunktionen durch Googles KI-Engine Gemini unterstützt werden. Das berichtet Bloomberg unter Berufung auf die üblichen mit den Verhandlungen vertrauten Quellen. Die Vereinbarung würde die langjährige Suchmaschinenpartnerschaft der beiden Unternehmen stärken, in deren Rahmen Google jährlich rund 20 Milliarden Dollar an Apple zahlt, um die Standardsuchmaschine zu bleiben.

Apple bereitet zwar eigene KI-Modelle für iOS 18 vor, dass Apple sich an Google wendet, um generative KI zu integrieren, wirft allerdings kein gutes Licht auf die eigenen Bemühungen in diesem Feld. Google hingegen könnte für seine Gemini-KI Milliarden potenzieller Nutzer erreichen. Die Verhandlungen sind laut Bloomberg noch nicht abgeschlossen. Ein Deal würde wahrscheinlich nicht vor Apples Entwicklerkonferenz im Juni bekannt gegeben. Apple soll aber auch mit OpenAI gesprochen haben, zieht also möglicherweise weitere Partner in Betracht.

Ein Apple-Google-Deal könnte kartellrechtliche Bedenken aufwerfen, da die Zusammenarbeit bei Suchmaschinen bereits von Regulierungsbehörden untersucht wird. Die Apple-Google-Kooperation steht auch mit Blick auf den im April in Kraft tretenden Digital Markets Act (DMA) auf wackeligen Füßen. Der DMA soll einen fairen Wettbewerb sicherstellen, indem er verhindert, dass die Tech-Riesen als sogenannte Gatekeeper ihre Marktmacht missbrauchen.

Ein Forschungsteam der Cornell University hat ein modulares System mit dem Namen Mosaic entwickelt. Es ermöglicht Robotern, zusammen mit Menschen verschiedene Aufgaben im Haushalt wie etwa Geschirrspülen, Wäschewaschen bis hin zum Kochen zu erledigen. Das System schafft es, dass die verwendeten Roboter in enger Interaktion mit dem Menschen teils komplexe Aufgaben durchführen können. Mosaic ist modular aufgebaut, schreiben die Wissenschaftlerinnen und Wissenschaftler in dem Paper "Mosaic: A Modular System for Assistive and Interactive Cooking", das auf Arxiv im Preprint erschienen ist. Es besteht aus verschiedenen Softwaremodulen und KI-Modellen, die jeweils unterschiedliche Aspekte einer Aufgabe angehen. So gibt es etwa einen interaktiven Aufgabenplaner, eine Architektur zur Identifizierung von Objekten und zur Planung der Bewegungen von Robotern sowie ein Modell zur Vorhersage der Bewegungen von Menschen.

Bei Praxistests zeigte sich, dass Mosaic in der Lage ist, effizient mit Menschen zusammenzuarbeiten. Die kollaborativen Kochversuche schloss das System zu 68,3 Prozent korrekt ab. Teilaufgaben erfüllte das System bei den sechs getesteten Rezepten zu 91,6 Prozent. Die Forschenden sehen Mosaic als Inspiration für die Entwicklung anderer Assistenzrobotersysteme, die im Haushalt helfen könnten. Sie wollen ihr bestehendes System nun verbessern und auch die Tests ausweiten.

Beim Hochladen von Videos auf YouTube ist ab sofort anzugeben, wenn die gezeigten oder hörbaren Inhalte echt zu sein scheinen, aber tatsächlich stark verändert oder synthetisch generiert worden sind. YouTube möchte also Inhalte gekennzeichnet sehen, in denen eine echte Person etwas sagt oder tut, das sie nicht gesagt oder getan hat. Das Gleiche gilt für Videos, die ein echtes Ereignis oder einen echten Ort verändert darstellen, oder die eine realistisch anmutende Szene enthalten, die so gar nicht stattgefunden hat. Aber auch synthetisch generierte Musik oder die Veränderung einer Stimme müssen das Label tragen.

Keine Kennzeichnung ist erforderlich für die bloße Anpassung von Farben oder den Einsatz von Filtern und Effekten. Außerdem entfällt die Kennzeichnungspflicht, wenn das Dargestellte ganz offensichtlich unrealistisch ist. In YouTube Studio gibt es dazu bei jedem Upload eine entsprechende Option. Wird sie aktiviert, erscheint im Begleittext zum Video der Hinweis, dass das Video verändert oder synthetisch erzeugt worden ist. Bei ausgewählten Themen wie Nachrichten, Wahlen, Gesundheit oder Finanzen macht YouTube den Hinweis sichtbarer, indem es ihn im Video selbst einblendet. Außerdem versucht YouTube automatisch zu erkennen, wenn generative Künstliche Intelligenz im Spiel war – sei es durch Verwendung YouTube-eigener KI-Werkzeuge für Kurzvideos oder durch Auswertung des Begleittextes.

Uploadern, die wiederholt gegen die neue Regel verstoßen, drohen schärfere Konsequenzen, darunter Ausschluss von finanziellen Ausschüttungen bis zum Ausschluss von der Plattform überhaupt.

(igr)