Web-Tipps: KI-Test-Arena

Welches Large Language Model eignet sich wofür? Der KI-Kompass erlaubt, über 50 Sprachmodelle kostenlos zu testen und zu vergleichen.

13.08.2024, 06:30 Uhr

Lesezeit: 1 Min.

c't Magazin

Von

Dr. Sabrina Patsch

buzzwoo.de/kuenstliche-intelligenz

Welches Large Language Model eignet sich für meine Zwecke am besten? Dieser Frage geht der KI-Kompass der Digitalagentur Buzzwoo aus Stuttgart nach. Mehr als 50 LLMs können Sie dort kostenlos und ohne Anmeldung testen und vergleichen. Zur Auswahl stehen verschiedene Versionen der LLMs von Alibaba Cloud, Anthropic, Cohere, Google, Meta AI, Mistral AI, OpenAI und Perplexity AI.

Werden zwei Kontrahenten gewählt, zeigt die Website verschiedene Kenngrößen im Vergleich an, darunter das Veröffentlichungsdatum, den Trainingszeitraum, ob es ein Open-Source-Projekt ist, wie viele Daten eingeflossen sind und ob es sich um ein multimodales Modell handelt. Auch die in verschiedenen Benchmarks wie MMLU oder HumanEval erzielten Scores werden angezeigt, falls bekannt. Eine detaillierte Erklärung der Kenngrößen bietet die Website nicht, stellt jedoch auf einzelnen Unterseiten Informationen zu den Anbietern zusammen und vergleicht die Versionen der entsprechenden Sprachmodelle.

In der Test-Arena kann man außerdem zwei LLMs direkt miteinander vergleichen. Dazu geben Nutzer einen beliebigen Prompt mit einer Länge von maximal 1000 Zeichen ein. Anschließend erscheinen die Antworten der beiden Modelle nebeneinander.

Weitere Web-Tipps finden Sie auf unserer Website.

Alle 14 Tage präsentiert Ihnen Deutschlands größte IT-Redaktion aktuelle Tipps, kritische Berichte, aufwendige Tests und tiefgehende Reportagen zu IT-Sicherheit & Datenschutz, Hardware, Software- und App-Entwicklungen, Smart Home und vielem mehr. Unabhängiger Journalismus ist bei c't das A und O.