Modell-Ranking für Kombiniert

AI BENCHY Kategorie

Sieh, welche KI-Modelle bei Kombiniert am besten abschneiden, welche zuverlässig bleiben und wo die größten Unterschiede liegen. Sortieren nach: Antwortzeit (Durchschnitt) ↓.

Angezeigte Modelle

Durchschnittlicher Wert für Kombiniert-Score

6.3

Bestes Modell

Ring-2.6-1T 10.0

Fehlergründe

Mit Fehlergrund Falsche Antwort52 Mit Fehlergrund Ungültiger Werkzeugaufruf19 Mit Fehlergrund API-Fehler13 Mit Fehlergrund Keine Antwort2 Mit Fehlergrund Zeitüberschreitung2 Mit Fehlergrund Anweisungen nicht befolgt1

Rang	Modell	Unternehmen	Kombiniert-Score	Punktzahl	Korrekte Tests	Antwortzeit (Durchschnitt)
#23	GLM 5 Turbo medium	Z.ai	10.0	8.0	1/1	13.9s
#114	Qwen3.5 Plus 2026-04-20 none	Qwen	2.8	5.7	0/1	13.3s
#71	Step 3.7 Flash high	Stepfun	10.0	7.0	1/1	13.0s
#7	Gemini 3.5 Flash medium	Google	10.0	9.0	1/1	12.0s
#63	GPT-5.3 Chat none	OpenAI	10.0	7.2	1/1	12.0s
#50	Gemini 3.1 Flash Lite Preview low	Google	3.0	7.4	0/1	11.9s
#44	Gemini 3.1 Flash Lite medium	Google	10.0	7.5	1/1	10.9s
#35	Gemini 3 PRO Preview medium	Google	3.0	7.6	0/1	10.4s
#111	Owl Alpha medium	Openrouter	3.0	5.7	0/1	10.0s
#118	Qwen3.6 27B none	Qwen	3.0	5.6	0/1	9.95s
#6	GPT-5.5 low	OpenAI	10.0	9.0	1/1	9.56s
#115	Qwen3.5-27B none	Qwen	2.8	5.7	0/1	9.39s
#24	GPT-5.2 Chat none	OpenAI	10.0	7.9	1/1	9.12s
#22	Step 3.7 Flash medium	Stepfun	10.0	8.0	1/1	9.06s
#151	Trinity Large Preview none	Arcee AI	3.0	4.6	0/1	8.91s

Kombiniert-Ranking

Top-Modelle nach Kombiniert-Score

Kombiniert-Score vs. Gesamtkosten

Top-Modelle nach Antwortzeit (Durchschnitt)