Sprachmodelle: Deutschlands Aufholjagd gegenüber den USA und China
Während China mit DeepSeek die USA im Wettkampf um die leistungsstärksten Sprachmodelle herausfordert, ist Europa nach wie vor Zuschauer, trotz genug Potenzial.
(Bild: KI, Collage c‘t)
- Thomas Brandstetter
Sprachmodelle sind mächtige Werkzeuge. Indem sie die herkömmliche Internetsuche ablösen, schwingen sie sich nicht nur zu wichtigen Informationsfiltern auf. Die Fähigkeit, in natürlicher Sprache mit ihren Nutzern zu interagieren, öffnet ihnen auch Tür und Tor zur menschlichen Psyche. Das birgt nicht nur Potenzial, Meinungen zu beeinflussen, sondern auch die Gesellschaft als Ganzes auf subtile Art zu durchdringen. Welchen Schaden digitale Technik in der Gesellschaft anrichten kann, zeigen Polarisierung, Hass und Desinformation in den sozialen Medien.
Um ähnliche Probleme mit Sprachmodellen zu vermeiden, wird es ein gesundes Maß an Transparenz und demokratisch legitimierter Kontrolle brauchen – und vor allem digitale Souveränität. Angesichts der autoritären Tendenzen in den USA und der Anbiederung der Big-Tech-CEOs an ihren Präsidenten bedarf es nicht allzu viel Fantasie, um sich vorzustellen, wie aus einem Werkzeug, das uns den Zugang zu Informationen erleichtern soll, eine dystopische Propagandamaschine werden könnte. Auch der Herausforderer DeepSeek ist durch die chinesische Regierung zensiert.
- Europäische Forscher und Unternehmen arbeiten an Sprachmodellen, um sich von Diensten aus den USA und China unabhängig zu machen.
- Projekte wie "LLäMmlein" und "Teuken 7B" zeigen, dass auch mit begrenzten Mitteln konkurrenzfähige Modelle möglich sind.
- Künftig braucht Europa mehr Investitionen, bessere Infrastruktur und stärkere Zusammenarbeit, um den Anschluss zu behalten.
Europäische Ansätze gibt es dabei durchaus. Der französische Hersteller Mistral AI entwickelt große Sprachmodelle in Europa, speichert seine Daten größtenteils in der EU und lässt seine Dienste auf Servern von Microsoft und Google in Irland und Schweden hosten. Dessen im Juli 2024 erschienenes Modell Large 2 konnte im c’t-Test mit den großen US-Anbietern mithalten. Politik und Presse gleichermaßen setzten große Hoffnungen in das Heidelberger Unternehmen Aleph Alpha. Das hat jedoch nicht zuletzt mangels finanzieller Mittel keine Ambitionen, ein großes deutschsprachiges Large Language Model (LLM) wie ChatGPT zu entwickeln. Es wendet sich stattdessen an Firmenkunden vor allem innerhalb der EU, die hohen Datenschutzstandards genügen müssen, wie Unternehmensberater und an Behörden wie die Bundesagentur für Arbeit. Ein großes deutschsprachiges LLM fehlt indes.
Das war die Leseprobe unseres heise-Plus-Artikels "Sprachmodelle: Deutschlands Aufholjagd gegenüber den USA und China". Mit einem heise-Plus-Abo können Sie den ganzen Artikel lesen.