KI-Update kompakt: Claude, Gesichtserkennung, NewsCorp, Canva Visual Suite

Das "KI-Update" liefert werktäglich eine Zusammenfassung der wichtigsten KI-Entwicklungen.

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmung wird hier ein externer Podcast (Podigee GmbH) geladen.

Podcasts immer laden

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Podigee GmbH) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

23.10.2024, 15:00 Uhr

Lesezeit: 9 Min.

Von

Isabel Grünewald
The Decoder

Anthropics Claude kann jetzt den Mauszeiger bewegen

Das KI-Unternehmen Anthropic hat ein Update für sein fortschrittlichstes Sprachmodell Claude 3.5 Sonnet angekündigt. Die neue Version kann nun direkt mit einem Computer interagieren, indem es den Mauszeiger bewegt, Bildschirminhalte erfasst und Buttons betätigt. Laut Anthropic ist es das erste KI-Modell mit dieser Fähigkeit. In einem Demonstrationsvideo wird gezeigt, wie das Modell ein Formular mit Adressdaten ausfüllt, indem es die benötigten Informationen sucht, das Formular öffnet und die Daten eingibt.

Trotz dieser beeindruckenden Neuerungen hat die Funktion noch erhebliche Einschränkungen. Sie basiert auf der Auswertung zahlreicher Screenshots, was komplexere Aktionen wie Scrollen oder Drag-and-Drop erschwert. Anthropic warnt vor dem Einsatz bei sensiblen Aufgaben und verspricht, proaktiv für eine sichere Verbreitung zu sorgen. Unklar bleibt, wie die erfassten Screenshots verarbeitet und gespeichert werden.

Neben der neuen Interaktionsfähigkeit hat Anthropic die allgemeine Leistung von Claude 3.5 Sonnet verbessert, insbesondere im Bereich des KI-unterstützten Programmierens. Auch das kleinste Modell, Haiku, wurde aktualisiert und soll bald verfügbar sein. Diese Entwicklungen unterstreichen Anthropics Bemühungen, seine KI-Modelle kontinuierlich zu verbessern und neue Anwendungsmöglichkeiten zu erschließen.

Meta testet Gesichtserkennung gegen Scam

Meta Platforms plant mit Gesichtserkennung gegen Scammer vorzugehen, die mit bekannten Persönlichkeiten werben oder sich als solche ausgeben. Solche Angebote würden vielfach dazu genutzt, um persönliche Daten und sogar Geld abzugreifen. Das verstoße gegen die Nutzungsbedingungen, schreibt Meta, und würde den Nutzern schaden. Da Werbung auf den Meta-Plattformen nicht von Menschen, sondern automatisiert geprüft und freigegeben wird, würden manche Scamming-Methoden nicht erkannt. Nun will der Konzern Gesichtserkennung einsetzen, um missbräuchliche Kampagnen mit Prominenten besser herausfiltern zu können.

Die betroffenen Personen werden darüber informiert und können selbst entscheiden, ob sie daran teilnehmen. Meta verspricht, alle während des Prozesses der Gesichtserkennung gesammelten Daten nach Abschluss der Prüfung zu löschen. Gesichtserkennung soll aber auch dabei helfen, einen verlorenen Zugang zu Facebook oder Instagram wiederherzustellen, etwa wenn eine Person ihr Kennwort vergessen, das Gerät verloren oder jemand anderes den Zugang zu ihrem Konto erlangt hat. Künftig sollen auch Video-Selfies zur Identifikation und damit zur Wiederherstellung von Nutzerkonten genügen, wenn das erkannte Gesicht zu Bildern des Profils passt. Zwar würden die Tests mit Gesichtserkennung weltweit durchgeführt, aber nicht in Großbritannien und der EU. In diesen Staaten erfordern strengere Datenschutzgesetze die explizite Einwilligung zu solchen Methoden. Die Gesichtserkennung zu Sicherheitszwecken und zum Kampf gegen Scam könnte ein Teil der Strategie Metas sein, europäische Gesetzgeber zur Öffnung von Datenschutzvorschriften zu bewegen, schreibt Techcrunch.

xAI stellt Modelle nun via API bereit

Elon Musks KI-Startup xAI hat eine API-Schnittstelle für sein Grok-Sprachmodell veröffentlicht. Die API enthält bisher nur das "grok-beta"-Modell, wobei unklar ist, welche Grok-Version genau dahintersteckt. Preislich liegt die API bei 5 Dollar pro Million Input-Token oder 15 Dollar pro Million Output-Token und ist damit deutlich teurer als beispielsweise GPT-4o.

Grok-2, das Flaggschiff-Modell von xAI, wird bereits für verschiedene Funktionen auf Musks Social Media Plattform X eingesetzt, unter anderem für Bilderzeugung und News-Zusammenfassungen. Perspektivisch soll es auch Suche, Nutzerprofile und Analysen verbessern. Mit der API will xAI nun zu Konkurrenten wie OpenAI und Anthropic aufschließen. Das Startup hatte im Mai 6 Milliarden Dollar eingesammelt und plant, seine Modelle mit Daten von Musks anderen Firmen wie Tesla und SpaceX zu trainieren.

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmung wird hier ein externer Podcast (Podigee GmbH) geladen.

Podcasts immer laden

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Podigee GmbH) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Neue Stable Diffusion 3.5-Modelle von Stability AI veröffentlicht

Stability AI hat die Veröffentlichung von Stable Diffusion 3.5 bekannt gegeben, einer neuen Generation von Modellen zur Bildgenerierung mit mehreren Varianten für verschiedene Nutzergruppen. Zwei Modelle sind sofort verfügbar: Stable Diffusion 3.5 Large mit 8 Milliarden Parametern für 1 Megapixel Auflösung und Stable Diffusion 3.5 Large Turbo, eine schnellere Version, die Bilder in nur 4 Schritten erzeugt. Ein drittes Modell, Stable Diffusion 3.5 Medium mit 2,5 Milliarden Parametern, soll am 29. Oktober erscheinen und auf Consumer-Hardware laufen.

Laut Stability AI führt Stable Diffusion 3.5 Large den Markt in Bezug auf Prompt-Befolgung an und kann in Sachen Bildqualität mit größeren Modellen mithalten. Die Modelle werden unter der Stability AI Community License veröffentlicht, die eine kostenlose Nutzung für nicht-kommerzielle Zwecke und eine kommerzielle Nutzung für Unternehmen mit einem Jahresumsatz unter 1 Million Dollar erlaubt.

Wie intelligent ist Künstliche Intelligenz eigentlich? Welche Folgen hat generative KI für unsere Arbeit, unsere Freizeit und die Gesellschaft? Im "KI-Update" von Heise bringen wir Euch gemeinsam mit The Decoder werktäglich Updates zu den wichtigsten KI-Entwicklungen. Freitags beleuchten wir mit Experten die unterschiedlichen Aspekte der KI-Revolution.

New York Times und News Corp gehen juristisch gegen Perplexity vor

Nach der New York Times gehen nun auch Tochterunternehmen von News Corp juristisch gegen die KI-Suchmaschine Perplexity vor. Dow Jones, der Mutterkonzern des Wall Street Journals, und NYP Holdings haben eine Klage wegen Urheberrechts- und Markenverletzung im New York District Court eingereicht. Sie werfen Perplexity vor, in massivem Umfang Inhalte ohne Erlaubnis oder Vergütung zu nutzen. Die Kläger fordern die Entfernung ihrer Inhalte aus dem Perplexity-Index sowie hohe Schadensersatzzahlungen. News Corp-CEO Robert Thomson spricht von einem "Missbrauch geistigen Eigentums" und kündigt an, auch gegen andere KI-Unternehmen vorzugehen. "Wir müssen die Inhalte-Kleptokratie herausfordern", so Thomson.

News Corp selbst hat einen Deal mit OpenAI abgeschlossen: Dieser beläuft sich laut Wall Street Journal auf 250 Millionen USD über fünf Jahre. Zuvor hatte bereits die NYT dem Startup eine Unterlassungsaufforderung zugestellt, da es NYT-Inhalte ohne Genehmigung für KI-generierte Zusammenfassungen verwende. Perplexity-CEO Aravind Srinivas wies die Vorwürfe zurück.

Bildgenerator Leonardo für Canva Visual Suite

Der Softwarehersteller Canva ist auf Einkaufstour, um seine gleichnamige Design-App zu erweitern. Im Sommer übernahm das australische Unternehmen das KI-Start-up Leonardo.Ai und integriert nun dessen Bildgenerator in seine Design-App. Er soll deutlich mehr Details und höhere Auflösung liefern als die bisher eingebaute KI. Mit der Design-App Canva entsteht auf einfache Weise gefälliges Grafikdesign für Print, Web und Social Media. Die Visual Suite umfasst Apps für Dokumente, Whiteboards, Webseiten, Präsentationen und Videos. Zu den KI-Funktionen gehören das Sprachmodell Magic Write, der KI-Layoutdienst Magic Design, der Bildradierer Magic Eraser und die Sammlung von KI-Generatoren Magic Media, die Bilder, Illustrationen und Videos generieren. Für Videos bindet Canva Technik von Runway ML ein.

Nach der Übernahme von Leonardo.Ai integriert Canva dessen Angebot nun in seine Visual Suite. Das im Oktober 2022 gegründete Unternehmen band zunächst intern ein Stable-Diffusion-Modell von StabilityAI ein, nutzt nun aber das eigens entwickelte Modell Phoenix.

ByteDance bestätigt Manipulationsversuch bei KI-Training

Der chinesische Konzern ByteDance hat die Entlassung eines Praktikanten bestätigt und damit auch auf Gerüchte in sozialen Medien reagiert. Dort wurde darüber spekuliert, ob ein Praktikant beim TikTok-Konzern immensen Schaden angerichtet hat. Die betroffene Person habe in böser Absicht das KI-Training für ein Forschungsprojekt manipuliert, teilte das Unternehmen jetzt mit. Die zentralen KI-Modelle von ByteDance seien nicht betroffen.

Die in chinesischen sozialen Netzwerken kursierende Behauptung, dass davon mehr als 8000 Grafikkarten betroffen seien und sich der Schaden auf mehrere Millionen US-Dollar belaufe, seien aber "stark übertrieben". Die Entlassung erfolgte demnach bereits im August, der zuständige Branchenverband, die Schulbehörde und die Universität des Praktikanten seien informiert worden.

KI-Lieferroboter beschleunigt Essenslieferungen von Uber Eats

Das Liefer- und Robotikunternehmen Serve Robotics hat seinen Lieferroboter in der dritten Generation stark überarbeitet. Er ist unter anderem intelligenter geworden, verfügt über mehr Stauraum und Reichweite und kann so bei verminderten Kosten bestelltes Essen schneller ausliefern. Kern der Verbesserungen des vierrädrigen Lieferroboters ist die Verwendung des KI-Computers Jetson Orin von Nvidia, der die autonomen mobilen Fähigkeiten steuert. Das Modul verfünffacht die Rechenleistung im Vergleich zum Vorgänger. Zusammen mit der leistungsfähigeren KI-Architektur von Serve Robotics können Navigationsentscheidungen schneller als bisher getroffen werden.

Uber Eats hat in den USA 2000 Stück davon geordert, die bereits im kommenden Jahr in mindestens zwei Städten eingesetzt werden sollen. Die Produktion der Roboter beim kanadischen Unternehmen Magna ist bereits angelaufen. Weitere Einheiten des Lieferroboters gehen nach Los Angeles. Dort sollen sie von der Restaurantkette Shake Shack und der Einzelhandelskette 7-Eleven sowie einem Metro-Markt für Auslieferungen eingesetzt werden.