KI-Update kompakt: Claude 3, ChatGPT, Microsoft vs. NYT, ElevenLabs

Das "KI-Update" liefert werktäglich eine Zusammenfassung der wichtigsten KI-Entwicklungen.

In Pocket speichern vorlesen Druckansicht

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmmung wird hier ein externer Podcast (Podigee GmbH) geladen.

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Podigee GmbH) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Lesezeit: 6 Min.
Von
Inhaltsverzeichnis

Anthropic hat seine neue Modellfamilie Claude 3 vorgestellt, die aus den KI-Sprachmodellen Claude 3 Haiku, Claude 3 Sonnet und Claude 3 Opus besteht. Die Modelle sollen OpenAIs GPT-4 in Tests übertreffen und sich jeweils auf Schnelligkeit, Kosten und Intelligenz konzentrieren. Zudem verfügen sie über spezielle visuelle Fähigkeiten. Eine API für Opus und Sonnet ist bereits verfügbar.

Opus ist das intelligenteste und teuerste Modell der Familie und schneidet in einigen gängigen Tests besser ab als GPT-4, z. B. bei Mathematikaufgaben auf Grundschulniveau. Allerdings verwendet Anthropic für diese Vergleiche die Benchmark-Werte der älteren GPT-4-Versionen und nicht die des neuesten GPT-4-Turbo. Dies liegt in den meisten Benchmarks immer noch vor Opus.

Haiku ist das günstigste Modell, jedoch weniger intelligent, während Sonnet als mittleres Modell schneller und intelligenter als Claude 2 ist. Alle drei Modelle verfügen über ein 200.000-Token-Kontextfenster und bieten weniger Halluzinationen und Bias als ihre Vorgänger. Anthropic plant zudem, eine Quellen-Funktion einzuführen, damit Nutzer die Antworten der Chatbots verifizieren können.

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmmung wird hier ein externer Podcast (Podigee GmbH) geladen.

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Podigee GmbH) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

OpenAI hat seinen Chatbot ChatGPT mit einer Vorlesefunktion für Antworten ausgestattet. Nutzer können sich nun den Antworttext des Chatbots in 37 verschiedenen Sprachen vorlesen lassen, indem sie auf den Text klicken oder ihn gedrückt halten. Fünf verschiedene Stimmen stehen zur Auswahl. ChatGPT konnte bereits auf Spracheingaben reagieren, die neue Funktion erweitert seine Fähigkeiten.

Die Vorlesefunktion wird sowohl für die Webversion als auch für die iOS- und Android-Apps zur Verfügung stehen. Um sie nutzen zu können, benötigen die Nutzer lediglich einen kostenlosen Zugang zu ChatGPT. Die Vorlesefunktion ist auch für GPT-4 verfügbar.

Im Herbst 2021 hatte OpenAI bereits eine Sprachfunktion für ChatGPT eingeführt, die die Eingabe von Audio-Prompts ermöglicht. Die neue Vorlesefunktion soll ebenfalls zur Barrierefreiheit des Chatbots beitragen. Allerdings klingen die KI-Stimmen nicht so natürlich wie die synthetisierten Stimmen von Anbietern wie ElevenLabs, was möglicherweise beabsichtigt ist, um das Missbrauchspotenzial zu verringern.

Wissenschaftler des Massachusetts Institute of Technology (MIT) haben ein KI-Modell entwickelt, das Hunderte von Robotern in Lagerhäusern effizient koordiniert und Kollisionen vermeidet. Das KI-Modell nutzt Methoden des Reinforcement Learning, um vorherzusagen, welche Bereiche des Lagers am besten entlastet werden sollten, um die Gesamteffizienz zu verbessern. Dabei werden die Fahrwege der Roboter, ihre Geschwindigkeit und mögliche Hindernisse berücksichtigt.

Das neuronale Netz teilt die Roboter in Gruppen ein, ermittelt die Gruppe mit dem größten Potenzial zur Verbesserung der Gesamtsituation und wendet suchbasierte Lösungsverfahren an, um die Wege der Roboter neu zu planen und Kollisionen zu vermeiden. Die Wissenschaftler testeten das System in simulierten Umgebungen und stellten fest, dass ihr lernbasiertes System viermal schneller arbeitete als nicht lernbasierte Systeme.

Im Rechtsstreit zwischen der New York Times und OpenAI über Urheberrechtsverletzungen könnte die Zukunft generativer KI-Technologien auf dem Spiel stehen. Microsoft, einer der Hauptinvestoren von OpenAI, hat einen Antrag auf Klageabweisung gestellt und wirft der New York Times "Weltuntergangs-Futurologie" vor. Der Technologiekonzern argumentiert, dass das Urheberrecht kein Hindernis für ChatGPT sei, da die Inhalte, mit denen das Tool trainiert wird, den Markt für diese Inhalte nicht verdrängen würden.

Microsoft zieht eine Analogie zu den 1980er-Jahren, als Hollywood-Studios die Einführung des Videorekorders verhindern wollten, weil sie glaubten, dass dieser ihre Urheberrechte verletzen würde. Dem entgegnet die Gegenseite, dass Hersteller von Videorekordern nie behauptet hätten, sich an massiven Urheberrechtsverletzungen beteiligen zu müssen, um ihre Produkte herzustellen. OpenAI hat kürzlich eingeräumt, dass aktuelle KI-Modelle nicht ohne urheberrechtlich geschützte Daten trainiert werden können.

OpenAI argumentiert ähnlich wie Microsoft, dass "ChatGPT in keiner Weise ein Ersatz für ein Abonnement der New York Times ist" und es bei normaler Nutzung von ChatGPT nicht möglich ist, Artikel der Zeitung zu reproduzieren.

Der Ausgang dieses Rechtsstreits könnte wegweisend sein für generative KI. Microsoft unterstützt OpenAI mit Investitionen von bis zu 13 Milliarden US-Dollar und exklusiven Vertriebsrechten für OpenAI-KI-Modelle.

Indien erwägt eine stärkere Regulierung von KI, die große Technologieunternehmen verpflichten würde, vor der Einführung neuer KI-Modelle die Genehmigung der Regierung einzuholen. Das indische Ministerium für Elektronik und Informationstechnologie (MeitY) hat eine Empfehlung veröffentlicht, die eine Prüfung und Genehmigung von ungeprüften KI-Plattformen durch das Ministerium vorsieht. Die Empfehlung ist noch nicht rechtsverbindlich, könnte es aber werden. Unternehmen müssten dann sicherstellen, dass ihre KI keine Voreingenommenheit oder Diskriminierung fördert und den Wahlprozess nicht beeinträchtigt.

Die KI-Branche in Indien zeigt sich überrascht und besorgt über die neuen Richtlinien. Es wird befürchtet, dass die Regulierung die Innovationskraft des Landes einschränken könnte. Der stellvertretende IT-Minister Rajeev Chandrasekhar betont jedoch, dass die Richtlinien hauptsächlich für große Plattformen gelten und Start-ups nicht betreffen. Er erklärt, dass die Maßnahmen darauf abzielen, ein sicheres und vertrauenswürdiges Internet zu gewährleisten und gleichzeitig die Unterstützung für KI-Technologien aufrechtzuerhalten.

Eleven Labs entwickelt eine KI, die Stimmen klonen kann, indem sie auf hochgeladene Sprachaufnahmen zugreift und Betonung und Sprechtempo übernimmt. Die KI ermöglicht es, beliebige Stimmen zu kopieren und mit der geklonten Stimme über Text-to-Speech oder Speech-to-Speech Inhalte zu generieren.

Heise-Redakteur Jan Philip Wöbbeking hat die Klonfähigkeit der KI getestet und untersucht, wie natürlich die erzeugten Stimmen klingen. Im Test vertauschte er die Stimmen der Redakteure Gregor Schollmeyer und Sophia Zimmermann, um die Leistungsfähigkeit der Technologie zu demonstrieren. Die KI von Eleven Labs bietet ein einfaches Browser-Tool, mit dem Nutzer eine Stimme virtuell trainieren können.

Empfohlener redaktioneller Inhalt

Mit Ihrer Zustimmmung wird hier ein externes YouTube-Video (Google Ireland Limited) geladen.

Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Google Ireland Limited) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.

Podcast: KI-Update

Wie intelligent ist Künstliche Intelligenz eigentlich? Welche Folgen hat generative KI für unsere Arbeit, unsere Freizeit und die Gesellschaft? Im "KI-Update" von Heise bringen wir Euch gemeinsam mit The Decoder werktäglich Updates zu den wichtigsten KI-Entwicklungen. Freitags beleuchten wir mit Experten die unterschiedlichen Aspekte der KI-Revolution.

(igr)