Drei Fragen und Antworten: DeepSeek – billiger und besser als KI von OpenAI?

Das Open-Source-Modell DeepSeek-R1 hat einen seismischen Schock durch die KI-Landschaft geschickt. Was dran ist am Big-Tech-Konkurrenten aus China.

vorlesen Druckansicht 3 Kommentare lesen
Ein roter Spielzeugroboter mit einer Sprechblase und drei Punkten drin.
Lesezeit: 4 Min.

Bislang setzt die US-Techbranche beim Training von KI-Modellen auf GPU-Materialschlachten und Rechenzentrums-Gigantomanie. Doch der chinesische Konkurrent Deepseek hat mit seinem deutlich günstigeren Ansatz bei vergleichbarer Modell-Performance für einen regelrechten Sputnik-Moment gesorgt – inklusive Börsenbeben bei Nvidia. Was dran ist am neuen Big-Tech-Schreck erklärt Danny Gerst, Titelautor der iX 3/2025, im Interview.

iX-Autor: Danny Gerst
iX-Autor: Danny Gerst

Danny Gerst ist seit 30 Jahren in der Softwareentwicklung und Beratung tätig. Als Strategieberater für den Mittelstand ist er regelbasierten Systemen bis zum KI-Zeitalter gefolgt.

Warum lohnt sich der Blick in den Maschinenraum von DeepSeek-R1?

DeepSeek-R1 ist das erste Open-Source-Modell, das mit einem führenden Reasoning-Modell wie OpenAIs o1 mithalten kann. Besonders bemerkenswert ist, wie DeepSeek das fast ausschließlich mit synthetischen Daten geschafft hat. Das Konzept, dass eine KI eine KI trainiert, ist nicht neu. Doch DeepSeek ist einen Schritt weiter gegangen. Statt nur ein bestehendes Modell zu verbessern, haben sie ein eigenes Zwischenmodell entwickelt, das gezielt Daten für die Schlussfolgerung generiert, um damit das finale Modell zu trainieren. Dieser mehrstufige Ansatz unterscheidet sich von allen bisherigen Methoden und ermöglicht auch bestehende Modelle gezielt nachzutrainieren, um ihre Fähigkeit zum logischen Schlussfolgern zu verbessern. Wir werden bald sehr viele entsprechend fein abgestimmte Modelle sehen.

Auch bei der Preisfrage gibt es Streit. Was genau war bei DeepSeek jetzt so gĂĽnstig zu trainieren?

Die tatsächlichen Trainingskosten von DeepSeek-R1 sind unbekannt. Seine Leistung basiert auf DeepSeek-V3, einem Modell, das DeepSeek bereits im vergangenen Jahr für rund sechs Millionen US-Dollar trainiert hat. Dieses Modell hat vor allem hinsichtlich Mathe- und Programmieraufgaben gezeigt, dass eine Hochleistungs-KI nicht zwingend Milliarden kosten muss. Die sechs Millionen US-Dollar beziehen sich auf die reinen Trainingskosten, nicht auf die Datenaufbereitung. Vergleicht man die Zahlen mit den geschätzten Kosten von GPT-4 und Llama 3, war DeepSeek-V3 um den Faktor 11 kostengünstiger im Training. Mit der Initiative Open R1 von Hugging Face könnte bald mehr Transparenz entstehen, auch hinsichtlich der Kosten für ein R1 Modell.

Videos by heise

Die API-Kosten von DeepSeek-R1 sind im Vergleich mit den Reasoning-Modellen von OpenAI ein Witz. Ist die Inferenz des Modells wirklich so gĂĽnstig?

DeepSeek-R1 basiert auf DeepSeek-V3, das bereits extrem effizient in der Inferenz ist. Wer sich für die technischen Details interessiert, dem empfehle ich die V3- und V2-Paper, in denen die wichtigsten Techniken beschrieben sind. Ein zentrales Beispiel bei R1 ist die bewusste Entscheidung, nicht auf CUDA zu setzen. CUDA ist das von Nvidia bereitgestellte Framework, das entscheidend zur aktuellen Monopolstellung im KI-Bereich beigetragen hat. Stattdessen hat das Team die Hardware direkt auf unterster Ebene angesprochen, wodurch unnötige Overheads vermieden wurden.

Doch damit nicht genug, hat DeepSeek neben dem effizienten Modell-Design auch gleich noch einen völlig neuen Tensortypen für ihren Anwendungsfall entwickelt. Im Ergebnis ist der Betrieb des Modells kostengünstig möglich, was sich direkt in den günstigen API Preisen widerspiegelt.

Danny, vielen Dank für die Antworten! Mehr zu Deepseek gibt es in der neuen iX - wir werfen einen Blick unter die Motorhaube und schauen auf die Reasoning-Fähigkeiten des KI-Modells. All das und viele weitere Themen finden Leser im März-Heft, das ab sofort im heise Shop oder am Kiosk erhältlich ist.

In der Serie "Drei Fragen und Antworten" will die iX die heutigen Herausforderungen der IT auf den Punkt bringen – egal ob es sich um den Blick des Anwenders vorm PC, die Sicht des Managers oder den Alltag eines Administrators handelt. Haben Sie Anregungen aus Ihrer tagtäglichen Praxis oder der Ihrer Nutzer? Wessen Tipps zu welchem Thema würden Sie gerne kurz und knackig lesen? Dann schreiben Sie mir oder hinterlassen Sie einen Kommentar im Forum.

(axk)