Wie Deepseek die KI-Szene aufmischt
Ein großes, angeblich besonders effizientes Sprachmodell aus China lässt den Aktienkurs von Nvidia einbrechen. Wir zeigen, was technisch dahintersteckt.
(Bild: Deepseek)
Es ist eine Geschichte wie aus dem Märchenbuch des Silicon Valley: Junger Nerd mit viel Herzblut, aber wenig Geld träumt von einem eigenen, bahnbrechenden Sprachmodell. Investoren winken müde lächelnd ab, weshalb er erst mal eine KI entwickelt, die einen Hedgefonds managt. Der ist nach einigen Jahren Milliarden wert. Davon kauft sich der mittlerweile nicht mehr ganz so junge Nerd eine Menge teurer Nvidia-Grafikkarten für ein eigenes Rechenzentrum und erfüllt sich seinen langjährigen Sprachmodell-Traum, anstatt sich wie andere Milliardäre seines Alters mit allerlei Luxusplunder einzudecken und größenwahnsinnig zu werden. Spätestens an dieser Stelle ahnt man: Das Märchen spielt nicht im Valley.
Es spielt in der südchinesischen Provinz Guangdong und dreht sich um den dort geborenen Technologieunternehmer Liang Wenfeng. Mit dem Valley hat es nur insofern zu tun, als das von ihm entwickelte Large Language Model namens Deepseek die auf Investorenmilliarden gebaute US-Tech-Szene gerade reichlich nervös macht. Denn Deepseek-R1 schneidet in anspruchsvollen Reasoning- und Mathematiktests besser ab als ChatGPT-o1 – und das bei angeblich deutlich schonenderem Umgang mit menschlichen, technischen und monetären Ressourcen.
Die Umwelt freut’s, Nvidia-Anleger weniger: Der Aktienkurs des bis dato alternativlosen Rohstofflieferanten fürs gehobene KI-Rechenzentrum verdampfte wie ein Tropfen auf einer überhitzten GB200-Grafikkarte: 17 Prozent Minus, ein Verlust von fast 600 Milliarden US-Dollar. Die Anleger befürchteten offenbar, dass dem Monopolisten Nvidia sein lukratives Geschäftsmodell abhandenkommen könnte. Insbesondere beim Training von High-End-Modellen kommt man derzeit an den raren, teuren und exportbeschränkten H100-GPUs nicht vorbei. Sparsame Grundlagenmodelle könnten die schwächeren GPUs der Konkurrenz wieder ins Spiel bringen.
Das war die Leseprobe unseres heise-Plus-Artikels "Wie Deepseek die KI-Szene aufmischt". Mit einem heise-Plus-Abo können Sie den ganzen Artikel lesen.