Blick ins Heft c’t 23/2024: Wettstreit der Sprachmodelle

Wir klopfen ChatGPT und seine Herausforderer ab: Was haben sie sprachlich auf dem Kasten, wie hoch ist ihr Energiebedarf und sind sie schon fit fĂĽr den AI Act?

In Pocket speichern vorlesen Druckansicht
Lesezeit: 6 Min.
Inhaltsverzeichnis

Hallo aus Hannover,

ChatGPT, Claude, Llama, Gemini, Mistral oder DeutschlandGPT: Wer gibt die klügsten Antworten? Wer lässt sich nicht von Fangfragen aufs Glatteis führen? Und können die überhaupt Deutsch? In der aktuellen c't beleuchten wir, wie die Fähigkeiten der großen Sprachmodelle üblicherweise ermittelt werden, worin die Schwächen solcher standardisierter Benchmarks liegen – und fühlen ihnen mit eigenen kniffligen Tests auf den Zahn.

Doch Qualität ist nicht alles. Während der Mensch von Luft, Liebe und ein paar Salatblättern leben und trotzdem noch passabel denken kann, saugen KIs die Stromnetze leer. Tech-Firmen und -Milliardäre denken sogar schon darüber nach, eigene kleine Atomkraftwerke für ihre Rechenzentren anzuschaffen, um den Bedarf künftig decken zu können. Wer gerade keines zur Hand hat und ein ressourcenschonendes Sprachmodell für privat oder den Einsatz in seiner Firma sucht, dem helfen unsere exemplarischen Messungen und darauf aufbauenden Berechnungen, die wir am KISSKI in Hannover durchgeführt haben.

Wichtig wird auch, was die ab 2025 geltende KI-Verordnung den Herstellern und Betreibern abverlangt. Wie lassen sich die Vorgaben der EU erfüllen und welche Modelle sind grundsätzlich besser darauf vorbereitet? Hitzige Diskussionen wurden geführt, viele Forderungen gestellt, rote Linien gezogen und wieder aufgeweicht. Wir erklären, worauf es jetzt wirklich ankommt.

(Bild: KI, Collage: c't)

Es ist Oktober 2024, die Heizsaison beginnt und, wer hätte es nach all der künstlichen Aufregung um den vermeintlichen "Heiz-Hammer" für möglich gehalten, es bollern immer noch jede Menge Öl- und Gasheizungen in deutschen Kellern. Denn wider Erwarten haben weder Robert Habeck noch die EU die guten alten Stücke zwangsstillgelegt oder persönlich abmontiert. Dafür werden sie mit den Jahren allmählich teurer, weil der CO2-Preis steigt.

Was tun? Wir befassen uns einfach mal ganz technologieoffen mit der Funktionsweise von Wärmepumpen. Georg Schnurer und Jan Mahn haben alles Wissenswerte rund um die Heiz- und Klimatechnik zusammengetragen, räumen mit Gerüchten auf und kalkulieren die Kosten für Anschaffung und Verbrauch. Auf Basis dieser Fakten kann sich jetzt jeder seine eigene Meinung bilden.

Während der CO2-Gehalt in der Atmosphäre weiter steigt, verfeuert der Großteil deutscher Heizungen weiter fossile Brennstoffe. Es gibt ökologische, vom Bund geförderte und oft günstigere Alternativen. Über die wichtigste, die Wärmepumpe, kursieren erstaunlich hartnäckige Gerüchte.

Vor zwanzig Jahren schickte sich Ubuntu an, die Welt der Linux-Distributionen aufzumischen. Eine wechselvolle Geschichte voller Irrungen und Wirrungen.

Für Behörden galt Microsoft 365 aus Datenschutzgründen lange als tabu. Nun wollen sechs Bundesländer mit speziell ausgehandelten Bedingungen die Clouddienste des US-Konzerns nutzen. Damit verärgern sie auch die Bundesregierung.

Woran erkennt man, dass Microsofts Werkzeugsammlung PowerToys erwachsen wird? Das erste von inzwischen 25 Tools hat den Legacy-Status erreicht. Lassen Sie sich davon nicht täuschen – das Paket ist mächtiger denn je.

Spiele greifen oft auf echte historische Schauplätze zurück und stricken dazu Charaktere, Geschichten und Spielmechaniken. Wir haben eine Auswahl der besten History-Games zusammengestellt, die mal mehr, mal weniger nah an den historischen Fakten bleiben.

In jüngster Zeit gibt es ungewöhnlich viele neue E-Book-Reader, und das hat nichts mit Weihnachten zu tun. Wir bringen ein wenig Ordnung ins Sortiment, damit Sie schneller Ihr Gerät für lange Leseabende finden.

Das ZenBook S 14 (UX5406) ist das erste Notebook mit Core Ultra 200V. Mit dieser CPU will Intel den Durchmarsch des ARM-Konkurrenten Qualcomm Snapdragon X stoppen. Der Prozessor punktet in der wichtigen Disziplin Akkulaufzeit, schwächelt aber anderweitig.

300 Jahre lang hat ein verschlĂĽsselter Brief in einem Archiv in London geschlummert. Mit modernen Verfahren und einem schnellen Computer hat ein Kryptologe dessen Geheimnis enthĂĽllt und liefert der Geschichtsforschung eine neue Quelle aus einer bewegten Zeit der englischen Geschichte.

Auf der Suche nach guten Erklärungen rund um die aktuellen Machine-Learning-Algorithmen und andere mathematische Themen freue ich mich immer, wenn ich gut gemachte Simulationen oder interaktive Anwendungen finde, die Komplexes leicht erfahr- und erfassbar machen. Eine solche ist der einfache Textgenerator SoekiaGPT von der Pädagogischen Hochschule Schwyz, auf den mich mein Kollege Jo Bager aufmerksam machte. Die zugehörige Website vermittelt einfach und plastisch, wie die großen Sprachmodelle prinzipiell funktionieren und nach welchen Kriterien sie Wort für Wort einen Text anhand der Nutzereingabe aufbauen.

Grundlage ist unter anderem ein Trainingsdatensatz aus 13 Märchen. Damit kommt SoekiaGPT qualitativ natürlich nicht ansatzweise an ChatGPT und Co. heran, aber dafür wurde es ja nicht gebaut. Vielmehr zeigt es, welche N-Gramme, also Wortfolgen, der Generator aus den Trainingsdaten extrahiert hat. Außerdem listet er die Wortvorschläge auf, die für die Fortsetzung der Geschichte infrage kamen. Jede Textpassage ist farbig hinterlegt, und zwar passend zum Dokument, aus dem sie stammt. Nutzer können mit den Einstellungen herumspielen, ein anderes der insgesamt fünf Themen wählen (unter anderem Musik, Tiergeschichten, Wetter) oder eigene Dokumente hochladen.

(atr)