KI-Kompass vergleicht rund 40 KI-Sprachmodelle 

Ein KI-Kompass soll Anwendern die Möglichkeit geben, rund 40 verschiedene Sprachmodelle zu testen und zu vergleichen.

In Pocket speichern vorlesen Druckansicht 4 Kommentare lesen
KI Kompass

Ein KI-Kompass soll bei der Navigation durch den LLM-Dschungel helfen.

(Bild: Buzzwoo)

Update
Lesezeit: 2 Min.

Mit einem KI-Kompass erhalten Nutzer die Möglichkeit, 40 verschiedene Large-Language-Modelle (LLMs) kostenlos und ohne Anmeldung zu testen. Darin enthalten sind die Sprachmodelle folgender Anbieter: Alibaba Cloud, Anthropic, Cohere, Google, Meta AI, Mistral AI, OpenAI und Perplexity AI. Dadurch sollen Anwender die Fähigkeiten der LLMs besser einschätzen und ein für ihre Anforderungen passendes Sprachmodell auswählen können. Veröffentlicht wurde der KI-Kompass von der Digitalagentur Buzzwoo, die derzeit auf der Suche nach Kooperationspartnern ist.

KI-Update abonnieren

Werktägliches Update zu den wichtigsten KI-Entwicklungen, freitags immer mit Deep Dive.​

E-Mail-Adresse

Ausführliche Informationen zum Versandverfahren und zu Ihren Widerrufsmöglichkeiten erhalten Sie in unserer Datenschutzerklärung.

In einer Eingabemaske lassen sich die verschiedenen LLMs in einem Dropdown-Menü auswählen. Es sind viele aktuelle Modelle erhalten, GPT-4o allerdings nicht. Anschließend bietet das Programm eine Übersicht, in der unter anderem steht, wann das LLM veröffentlicht wurde, bis zu welchem Zeitpunkt neue Daten eingeflossen sind und ob es frei verfügbar ist.

In einer weiteren Tabelle "Technisch/Kosten" gibt es Angaben zur Größe des Modells, Angaben zur Kontextlänge, wie hoch die Kosten pro eine Million Token sind und ob das Modell über multimodale Fähigkeiten verfügt – beispielsweise Bilder oder Videos.

In der virtuellen "Test-Arena" können zwei Sprachmodelle gegeneinander antreten.

(Bild: Buzzwoo)

Anschließend folgt eine Auflistung darüber, wie das Sprachmodell bei Benchmarks wie dem HumanEval-Score abgeschnitten hat, sofern dort Daten vorhanden sind.

In einer Test-Arena können Nutzer die Sprachmodelle testen. Es lassen sich auch zwei Sprachmodelle auswählen, die dann als Textprompt eine Aufgabe erhalten. Anschließend werden die Ergebnisse nebeneinander aufgelistet.

Wer noch mehr LLMs ausprobieren will, kann das bei der Chatbot-Arena tun. Dort gibt es 71 Sprachmodelle, die gegeneinander antreten können. Federführend an der Arena beteiligt sind die Large Model Systems Organization und die University of California, Berkeley.

Update

Hinweis auf lmsys.org ergänzt.

(mack)