KI-Update kompakt: DeepSeek, ChatGPT Gov, Qwen 2.5, KI-Ausstellung
Das "KI-Update" liefert werktäglich eine Zusammenfassung der wichtigsten KI-Entwicklungen.
- Isabel Grünewald
- The Decoder
Warum Deepseek R1 nicht das Ende von OpenAI und Meta bedeutet
Das chinesische KI-Modell von DeepSeek hat bei den großen KI-Playern in den USA für Aufsehen gesorgt. Besonders beunruhigend für die US-amerikanische KI-Industrie waren zwei Aspekte: DeepSeek gibt an, ihr Modell V3 auf nur 2.000 H800 GPUs von Nvidia trainiert zu haben, was lediglich rund 5,5 Millionen Dollar gekostet hat - ein Bruchteil der Trainingskosten von OpenAI. Zudem wurde das Modell als Open Source veröffentlicht, was für China, das normalerweise seine KI-Industrie streng reguliert, ungewöhnlich ist.
Die hohe Trainingseffizienz ist vermutlich das Ergebnis von Vorarbeiten mit weniger effizienten großen Modellen, die heuristische Verfahren und Trainingsdaten für die effizientere Schulung kleinerer Nachfolgemodelle lieferten. Dieses als "Distillation" bekannte Verfahren ist in der Branche üblich.
Das Training war möglich, weil es vor den verschärften Ausfuhrbeschränkungen für KI-Chips nach China begann. DeepSeek und andere chinesische Unternehmen hatten sich zuvor mit großen Mengen der A100-Chips von Nvidia eingedeckt - Schätzungen zufolge zwischen 10.000 und 50.000 Stück.
Chinas KI-Entwicklungspolitik zielt darauf ab, die Wirtschaft durch KI effizienter zu gestalten. Dabei wechseln sich Phasen strenger Regulierung mit Phasen größerer Öffnung ab. Nach anfänglichem Enthusiasmus und massiven Investitionen folgte eine Phase strenger Kontrolle. Aktuell liegt der Fokus auf wirtschaftlich nützlichen Modellen, was die Open-Source-Veröffentlichung von DeepSeek R1 erklärt. Diese Öffnung könnte sich jedoch wieder ändern, sobald die Regierung Kontrollverlust befürchtet.
DeepSeek deaktiviert Registrierung nach Cyberattacken
DeepSeek wurde kürzlich Ziel von Cyberattacken, die das Unternehmen zu Gegenmaßnahmen zwangen. Auf der Status-Webseite berichtet DeepSeek von "verminderter Performance" seit Montag, dem 27. Januar. Anfänglich waren weder Login noch API oder Web-Interface nutzbar. Nach ersten Untersuchungen wurden die Dienste mit eingeschränkter Geschwindigkeit wieder verfügbar gemacht. Am Dienstag deaktivierte DeepSeek die Registrierung neuer Konten, während bestehende Accounts weiterhin genutzt werden konnten.
OpenAI startet ChatGPT für US-Behörden
OpenAI-CEO Sam Altman hat sich zum Hype um das chinesische KI-Startup geäußert. Er bezeichnet DeepSeeks R1 als "beeindruckendes Modell", vor allem was das Preis-Leistungs-Verhältnis angeht. Gleichzeitig betont er aber, dass OpenAI "natürlich viel bessere Modelle liefern" werde. Ein neuer Konkurrent sei belebend und OpenAI werde einige Veröffentlichungen beschleunigen. Der Fokus liege jedoch weiter auf der eigenen Forschungsroadmap.
Passend dazu startet das Unternehmen eine spezielle Version von ChatGPT für US-Behörden. "ChatGPT Gov" soll es Regierungsstellen erleichtern, die neuesten KI-Modelle in ihrer eigenen Cloud bereitzustellen und dabei Sicherheits- und Datenschutzanforderungen zu erfüllen. Über 90.000 Nutzerinnen und Nutzer in 3.500 Behörden setzen ChatGPT bereits ein.
Vier von fünf Firmen haben keinen Plan von KI
In 79 Prozent der deutschen Unternehmen fehlt es an Kompetenzen zum Umgang mit Künstlicher Intelligenz. Derzeit schöpfen 86 Prozent der Betriebe die Möglichkeiten von KI noch nicht oder nur in einem geringen Maß aus. Das zeigt eine Studie des Stifterverbandes für die Deutsche Wissenschaft und des Beratungsunternehmens McKinsey, für die mehr als 1000 Führungskräfte aus deutschen Unternehmen unterschiedlicher Größe befragt wurden.
Demnach verfügt die Mehrheit der deutschen Unternehmen bislang über keine Strategie zum Aufbau von Fähigkeiten im Umgang mit künstlicher Intelligenz. Nur ein Viertel der Befragten gibt an, eine klare Vorgehensweise definiert zu haben. 54 Prozent der Führungskräfte merken an, dass in ihren Unternehmen zu wenig in KI-Schulungen investiert werde. Sie begründen dies mit der geringen Nutzung von KI, Budgetengpässen und Unsicherheiten bei den benötigten Qualifikationen. Ebenfalls stellt mehr als die Hälfte der Unternehmen ihren Mitarbeiterinnen und Mitarbeitern keine Lernangebote für KI zur Verfügung.
Empfohlener redaktioneller Inhalt
Mit Ihrer Zustimmung wird hier ein externer Podcast (Podigee GmbH) geladen.
Ich bin damit einverstanden, dass mir externe Inhalte angezeigt werden. Damit können personenbezogene Daten an Drittplattformen (Podigee GmbH) übermittelt werden. Mehr dazu in unserer Datenschutzerklärung.
Alibabas neue Sprachmodelle mit Millionen-Token-Kontext
Alibaba präsentiert neue Open-Source-Sprachmodelle, die ein großes Kontextfenster von bis zu einer Million Token verarbeiten können. Die Modelle erscheinen in zwei Varianten: Qwen 2.5 mit 7 und 14 Milliarden Parametern. Das Kontextfenster ist bislang einzigartig im Open-Source-Bereich, während kostenpflichtige Dienste wie Google Gemini das schon bieten.
Experten diskutieren den praktischen Nutzen solch großer Kontextfenster und verweisen auf effizientere Alternativen wie RAG-Architekturen mit kleineren Fenstern von etwa 128.000 Token. Dennoch überzeugen die Qwen-Modelle in Benchmarks für lange Texte. Das Qwen2.5-14B-Instruct-1M-Modell erreichte als erstes seiner Art über 90 Punkte im RULER-Benchmark und übertraf GPT-4o mini in mehreren Tests.
Neue chinesische Open-Source-Alternative zu KI-Musikdiensten
Mit "YuE" gibt es jetzt eine frei verfügbare Alternative zu KI-Musikgeneratoren wie Suno oder Udio.
Das Programm kann auf Basis von Songtexten ganze Songs in verschiedenen Sprachen und Musikstilen erstellen, inklusive Gesang. Nutzerinnen und Nutzer können den Stil, die Stimmung und die Stimmart selbst bestimmen.
KI zum Anfassen im Deutschen Technikmuseum
In Berlin wurde das Innovations- und Qualitätszentrum eröffnet, eine Mitmach-Ausstellung im Rahmen der nationalen Initiative "Mission KI". Das vom Bundesdigitalministerium unterstützte Projekt ist an das Deutsche Technikmuseum angegliedert.
Neben informativen Schautafeln bietet das KI-Zentrum verschiedene interaktive Stationen. Digitalminister Volker Wissing betont, dass das Zentrum das Vertrauen in KI stärken soll. Besucher und Schulklassen können hier praktische KI-Anwendungen erleben.
Zu den Attraktionen gehört die App SkinDoc zur Hautuntersuchung, ein per Controller steuerbarer Roboter und Software zur Gesichtserkennung und -anonymisierung. Wissing ist überzeugt, dass vertrauenswürdige, zertifizierte KI aus Europa künftig stark nachgefragt sein wird.
KI zeigt: Kohlenwasserstoffe kamen von außen nach Ceres
Das organische Material auf dem Zwergplaneten Ceres ist wahrscheinlich nicht auf Ceres entstanden. Zu diesem Ergebnis kommt ein Team des Max-Planck-Instituts für Sonnensystemforschung (MPS) in Göttingen, nachdem es die Daten, die die Raumsonde Dawn von dem Zwergplaneten sammelte, mithilfe von KI umfassend ausgewertet hat.
Bei Messungen mit dem Spektrometer hatte Dawn in mehreren Kratern des Zwergplaneten Hinweise auf organische Moleküle gefunden.
(igr)