KI-Update kompakt: Perplexity, sichere Superintelligenz, Meta, DALL-E 3

Das "KI-Update" liefert werktäglich eine Zusammenfassung der wichtigsten KI-Entwicklungen.

In Pocket speichern vorlesen Druckansicht 1 Kommentar lesen

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmmung wird hier ein externer Podcast (Podigee GmbH) geladen.

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Podigee GmbH) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Lesezeit: 7 Min.
Von
Inhaltsverzeichnis

Die "Antwortmaschine" Perplexity, wie CEO Aravind Srinivas sie nennt, gibt statt einer Link-Liste eine Antwort im Fließtext, gespickt mit Links zu den Quellen und Stichpunkten. Dafür nutzt Perplexity Echtzeit-Informationen und tägliche Snapshots von Crawlern. Doch der Perplexity-Bot ignoriert offenbar den Web-Standard der robots.txt-Datei, die Crawlern sagt, wo sie nicht scannen sollen. Das führt dazu, dass Perplexity auch Artikel zitieren und wiedergeben kann, die der Antwortmaschine nicht vorliegen sollten.

Betroffen sind Artikel von Wired und anderen Condé-Nast-Publikationen. Wired berichtet, dass die Wiedergabe nicht immer richtig ist und teilweise falsche Informationen enthält. Der Perplexity-Bot nutzt mindestens eine unveröffentlichte IP-Adresse, mit der er sich über die Regeln zum Scrapen von Inhalten hinwegsetzt. Auch andere Verlage wie Forbes, CNBC und Bloomberg beschweren sich über Perplexity Pages, KI-generierte Übersichten, die auf ihren Exklusivbeiträgen basieren und teils hinter Bezahlschranken stehen.

Perplexitys CEO Srinivas kündigte an, die Quellen künftig prominenter zu verlinken und Verlage an den Einnahmen zu beteiligen. Dafür ist ein neues Analytics-System geplant, das zählt, wie oft eine Information gelesen oder genutzt wird. Laut Berichten ist Perplexity auch in Gesprächen mit Verlagen über Kooperationen, ähnlich wie OpenAI einzelnen Verlagen Geld dafür bezahlt, deren Inhalte sowohl für das Training der eigenen KI-Modelle zu nutzen als auch bevorzugt anzuzeigen. Eine Einigung wird wohl nicht so schnell kommen und eine neue Diskussion um das Leistungsschutzrecht und Urheberrecht wahrscheinlich.

Der OpenAI-Mitbegründer Ilya Sutskever, der das KI-Unternehmen erst vor Kurzem verließ, hat ein eigenes Start-up gegründet. Er will in seinem neuen Unternehmen Safe Superintelligence Inc., wie der Name schon sagt, eine sichere Superintelligenz schaffen. Viel hat das neue Start-up noch nicht vorzuweisen. Eine einfache Website mit einem Hinweis auf die Safe Superintelligence, Social-Media-Accounts und ein kleines Team sind alles, was bisher auf das Projekt hindeutet. Neben Sutskever sind Apples ehemaliger KI-Chef Daniel Groß und Daniel Levy, ein Ex-Mitarbeiter von ChatGPT-Schöpfer OpenAI, im Team. Die drei haben die Mitteilung auf der Webseite unterzeichnet. "Superintelligenz ist zum Greifen nah. Der Aufbau einer sicheren Superintelligenz (kurz SSI) ist das wichtigste technische Problem unserer Zeit", ist dort zu lesen.

Sutskever und seine Mitstreiter beabsichtigen, eine Superintelligenz zu schaffen, von der keine Gefahr ausgeht. Das sei das alleinige Ziel des Unternehmens. Ein anderes Produkt soll es nicht geben. Es sollen Mitarbeiterinnen und Mitarbeiter angeheuert werden, um "das erste SSI-Labor der Welt" aufzubauen. Unklar ist allerdings die Finanzierung. In der Ankündigung heißt es lediglich, dass Investoren vorhanden sind. Sutskever gilt weltweit als einer der führenden Köpfe hinsichtlich Künstlicher Intelligenz. Der kanadische Informatiker hatte OpenAI mitgegründet und war maßgeblich an der Entwicklung von ChatGPT beteiligt. Sutskever verließ OpenAI nach zehn Jahren im Mai 2024. Er schied aus dem Unternehmen aus, weil er befürchtete, dass kommerzielle Interessen über der Sicherheit bei der Weiterentwicklung von ChatGPT stehen könnten.

Meta hat eine Reihe neuer KI-Modelle für Text, Bild und Audio veröffentlicht. Dazu gehört Chameleon, ein multimodales Modell, das Bilder und Text sowohl verarbeiten als auch generieren kann. Es akzeptiert jede Kombination von Text und Bildern als Ein- und Ausgabe.

Kurz vor Chameleon zeigte Meta auch einen neuen Ansatz, um bessere und schnellere große Sprachmodelle zu entwickeln: die Multi-Token-Vorhersage. Das Team konnte zeigen, dass die Vorhersage mehrerer Token beim Training von KI-Sprachmodellen die Leistung verbessert. Meta veröffentlicht die vortrainierten Modelle zur Code-Vervollständigung. Ein weiteres Modell namens JASCO generiert Musik aus Texteingaben und anderen Parametern wie Akkorden oder Beats.

Das Unternehmen stellt außerdem AudioSeal vor, eine Audio-Wasserzeichen-Technologie, die KI-generierte Sprache in längeren Audio-Segmenten bis zu 485-mal schneller erkennen und markieren soll als herkömmliche Methoden. Die Modelle Chameleon und die Code-Vervollständigung auf Basis der Multi-Token-Vorhersage werden unter einer nicht kommerziellen Lizenz für Forschungszwecke veröffentlicht. AudioSeal erscheint unter einer kommerziellen Lizenz.

In sozialen Medien häufen sich Berichte über ein nicht angekündigtes Upgrade, das OpenAI DALL-E 3 spendiert haben soll. Vor allem bei der Generierung von Schrift, auch längeren Textblöcken, scheint DALL-E 3 nun mehr Fähigkeiten zu besitzen.

Tests zeigen, dass DALL-E 3 tatsächlich jetzt besser Text generieren kann, aber immer noch Lücken zwischen der aktuellen Leistung und den demonstrierten Fähigkeiten von GPT-4o liegen – aber auch zu Midjourney v6 und Ideogram. Interessant wird sein, ob und wie OpenAI mit DALL-E weitermachen wird. Qualitativ könnte GPT-4o das Bildmodell wohl ablösen, zumindest deuten die Demonstrationen von OpenAI darauf hin.

Wie sich OpenAI entscheidet – ob spezialisiertes Bildmodell oder großes multimodales Modell – und wie sich GPT-4o dann im Wettbewerb schlägt, könnte auch ein Fingerzeig sein, wie sich KI-Modelle insgesamt entwickeln.

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmmung wird hier ein externer Podcast (Podigee GmbH) geladen.

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Podigee GmbH) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Während der Europameisterschaft im Herren-Fußball entstehen derzeit riesige Datenmengen. Ein Forschungsteam um Professor Daniel Link von der Technischen Universität München will daraus mithilfe von KI-Methoden Prognosen und Analysen erstellen. Ihr Ziel ist es, komplexe taktische Konstrukte wie Pressing oder Gegenpressing mittels Künstlicher Intelligenz zu erkennen und abzuschätzen, in welchen Situationen welche Spielweise erfolgreich ist. Darüber hinaus ermöglicht die wissenschaftliche Analyse von Spieldaten, Leistungsindikatoren wie Laufleistung, Passquoten und Zweikampfstatistiken zu bewerten.

Das Team nutzt dafür drei verschiedene Datenquellen. Sie erfassen die Spielergebnisse wie Pässe, Torschüsse oder Zweikämpfe manuell durch Datenlogger. Außerdem kommen optische Verfahren zum Einsatz: Mehrere Kameras erfassen das Spielfeld und erkennen die Bewegungen der Spieler und des Balls im Videobild. Zusätzlich ist bei der EM 2024 der Ball selbst mit einem Sensor versehen. "All diese Daten helfen, einzelne Aspekte besser zu verstehen und Trainingsbelastungen zu steuern. Wir stehen erst am Anfang, wenn es darum geht, diese Daten umfassend zu nutzen", ist Link überzeugt.

Podcast: KI-Update

Wie intelligent ist Künstliche Intelligenz eigentlich? Welche Folgen hat generative KI für unsere Arbeit, unsere Freizeit und die Gesellschaft? Im "KI-Update" von Heise bringen wir Euch gemeinsam mit The Decoder werktäglich Updates zu den wichtigsten KI-Entwicklungen. Freitags beleuchten wir mit Experten die unterschiedlichen Aspekte der KI-Revolution.

TikTok hat mit Symphony Digital Avatars ein neues KI-Tool für Werbetreibende vorgestellt. Damit lassen sich digitale Avatare von realen Personen erstellen, die in Markeninhalten zum Einsatz kommen sollen.

Es gibt zwei Arten von Avataren: Stock-Avatare, die vorgefertigt sind und von bezahlten Schauspielerinnen und Schauspielern erstellt wurden, und benutzerdefinierte Avatare, mit der Kreative oder Marken ihre eigenen erstellen können. Mithilfe des KI-Tools Symphony AI Dubbing können die erstellten Inhalte zudem in verschiedene Sprachen übersetzt werden.

(igr)