Web-Tipps: KI-Test-Arena
Welches Large Language Model eignet sich wofĂĽr? Der KI-Kompass erlaubt, ĂĽber 50 Sprachmodelle kostenlos zu testen und zu vergleichen.
buzzwoo.de/kuenstliche-intelligenz
Welches Large Language Model eignet sich für meine Zwecke am besten? Dieser Frage geht der KI-Kompass der Digitalagentur Buzzwoo aus Stuttgart nach. Mehr als 50 LLMs können Sie dort kostenlos und ohne Anmeldung testen und vergleichen. Zur Auswahl stehen verschiedene Versionen der LLMs von Alibaba Cloud, Anthropic, Cohere, Google, Meta AI, Mistral AI, OpenAI und Perplexity AI.
Werden zwei Kontrahenten gewählt, zeigt die Website verschiedene Kenngrößen im Vergleich an, darunter das Veröffentlichungsdatum, den Trainingszeitraum, ob es ein Open-Source-Projekt ist, wie viele Daten eingeflossen sind und ob es sich um ein multimodales Modell handelt. Auch die in verschiedenen Benchmarks wie MMLU oder HumanEval erzielten Scores werden angezeigt, falls bekannt. Eine detaillierte Erklärung der Kenngrößen bietet die Website nicht, stellt jedoch auf einzelnen Unterseiten Informationen zu den Anbietern zusammen und vergleicht die Versionen der entsprechenden Sprachmodelle.
In der Test-Arena kann man außerdem zwei LLMs direkt miteinander vergleichen. Dazu geben Nutzer einen beliebigen Prompt mit einer Länge von maximal 1000 Zeichen ein. Anschließend erscheinen die Antworten der beiden Modelle nebeneinander.
Weitere Web-Tipps finden Sie auf unserer Website.
Ihr könnt die c't auch bei WhatsApp abonnieren: Wir schicken werktäglich Einordnungen zu aktuellen Themen und Einblicke in den Redaktionsalltag.
(spa)