DeepSeek-R1: Neues KI-Sprachmodell mit Reasoning aus China gegen OpenAI o1

Wie OpenAIs o1 benötigt auch DeepSeek-R1 mehr Zeit zum Antworten, soll in vielen Fällen aber akkurater sein als andere KI-Modelle. Und es wird Open-Source.

In Pocket speichern vorlesen Druckansicht 4 Kommentare lesen

(Bild: incrediblephoto / Shutterstock.com)

Lesezeit: 3 Min.
Von
  • Frank Schräer

Das chinesische KI- und Investmentunternehmen High-Flyer hat mit DeepSeek-R1 ein neues KI-Modell mit Reasoning veröffentlicht, das es mit westlichen Modellen künstlicher Intelligenz wie o1 von OpenAI aufnehmen will. KI-Modelle dieser Art werden darauf trainiert, komplexe Probleme gründlicher zu durchdenken, bevor sie eine Antwort liefern. Die Leistung des offiziell "DeepSeek-R1-Lite-Preview" genannten KI-Modells soll laut den Entwicklern das Niveau von OpenAI o1 erreichen. Open-Source-Versionen von DeepSeek-R1 sind in Vorbereitung.

Erst vor rund zwei Monaten hat OpenAI neue KI-Modelle mit verbessertem Reasoning veröffentlicht. o1-preview und o1-mini sollen durch erweitertes Reasoning besser in der Lage sein, anspruchsvolle Aufgaben in Wissenschaft, Programmierung und Mathematik zu bewältigen. Als Beispiele dafür führt OpenAI die Annotation von Zellsequenzierungsdaten, Erstellung komplizierter mathematischer Formeln für die Quantenoptik und Erstellung und Ausführung mehrstufiger Arbeitsabläufe für Entwickler an.

Diese Ziele peilen auch Chinas KI-Entwickler mit DeepSeek-R1 an. In populären KI-Benchmarks wie AIME und MATH erreicht dieses KI-Modell laut DeepSeek das Leistungsniveau von OpenAI o1-preview und liegt demnach deutlich vor KI-Sprachmodellen wie GPT-4o und Claude 3.5 Sonnet von Anthropic. Mit AIME ist ein Leistungsvergleich von KI-Modellen möglich, während MATH eine Sammlung von Wortproblemen darstellt, denen sich die KI-Modelle stellen müssen.

Allerdings macht auch DeepSeek-R1 Fehler, wie Beispiele bei X zeigen. So hatte das KI-Modell beim Spiel Tic-Tac-Toe die Wahl zwischen einem siegreichen und einem defensiven Zug, um den Sieg des Menschen zu verhindern, wählte aber die Defensive. Auch scheiterte DeepSeek-R1 an komplexen logischen Problemen und konnte sogar dazu gebracht werden, ein detailliertes Rezept für Methamphetamin darzustellen. Diese Rauschdroge ist in vielen Ländern der Welt verboten.

Zudem verweigert DeepSeek-R1 Antworten auf politische Fragen, die China betreffen, etwa zu den Beziehungen von Xi Jinping, dem Staatspräsidenten Chinas, und dem zukünftigen US-Präsidenten Donald Trump oder auch zu den geopolitischen Auswirkungen einer chinesischen Invasion Taiwans. Darauf antwortet DeepSeek-R1 mit dem immer gleichen Satz: "Tut mir leid, ich bin mir noch nicht sicher, wie ich diese Art von Fragen angehen soll. Lass uns stattdessen über Mathematik, Codierung und Logikprobleme chatten." Offenbar wollen die KI-Entwickler mögliche Konflikte mit der chinesischen Staatsführung vermeiden.

DeepSeek-R1 ist nicht das erste KI-Modell dieses auch in kĂĽnstliche Intelligenz investierenden quantitativen Hedgefonds aus dem chinesischen Hangzhou. In diesem FrĂĽhjahr wurde mit DeepSeek V2 ein ChatGPT-4-Konkurrent aus China freigeschaltet. Dieser KI-Chat ist ebenfalls Open-Source, agierte bei bestimmten Themen aber ebenfalls unwillig, etwa bei Fragen ums Tianmen-Massaker. Auch andere Fragen, die die Weltpolitik betreffen, wurden bei unseren ersten Tests aus klar chinesischer Perspektive beantwortet.

(fds)