Modell-Ranking für Kombiniert

AI BENCHY Kategorie

Sieh, welche KI-Modelle bei Kombiniert am besten abschneiden, welche zuverlässig bleiben und wo die größten Unterschiede liegen. Sortieren nach: Antwortzeit (Durchschnitt) ↓.

Angezeigte Modelle

Durchschnittlicher Wert für Kombiniert-Score

6.3

Bestes Modell

Ring-2.6-1T 10.0

Fehlergründe

Mit Fehlergrund Falsche Antwort52 Mit Fehlergrund Ungültiger Werkzeugaufruf19 Mit Fehlergrund API-Fehler13 Mit Fehlergrund Keine Antwort2 Mit Fehlergrund Zeitüberschreitung2 Mit Fehlergrund Anweisungen nicht befolgt1

Rang	Modell	Unternehmen	Kombiniert-Score	Punktzahl	Korrekte Tests	Antwortzeit (Durchschnitt)
#43	MiMo-V2.5-Pro medium	Xiaomi	10.0	7.5	1/1	53.4s
#92	Laguna M.1 medium	Poolside	3.0	6.4	0/1	53.1s
#117	Qwen3.5-35B-A3B none	Qwen	3.0	5.6	0/1	47.4s
#119	Cobuddy medium	Baidu	3.0	5.6	0/1	47.4s
#25	Qwen3.5 Plus 2026-02-15 medium	Qwen	10.0	7.9	1/1	46.8s
#52	Claude Sonnet 4.6 medium	Anthropic	10.0	7.4	1/1	46.4s
#33	Hy3 preview medium	Tencent	10.0	7.7	1/1	46.0s
#131	Qwen3.5-122B-A10B none	Qwen	3.0	5.3	0/1	46.0s
#140	Qwen3 Coder Next none	Qwen	3.0	4.9	0/1	45.1s
#41	Nemotron 3 Ultra 550b A55b medium	NVIDIA	9.8	7.5	1/1	43.9s
#55	GLM 5.1 medium	Z.ai	9.5	7.3	1/1	43.1s
#130	MiniMax M2.7 medium	Minimax	4.7	5.3	0/1	41.0s
#60	Kimi K2.6 medium	Moonshot AI	10.0	7.2	1/1	41.0s
#4	Gemini 3.1 Pro Preview medium	Google	9.5	9.4	1/1	40.6s
#10	Claude Opus 4.8 medium	Anthropic	9.8	8.7	1/1	38.0s

Kombiniert-Ranking

Top-Modelle nach Kombiniert-Score

Kombiniert-Score vs. Gesamtkosten

Top-Modelle nach Antwortzeit (Durchschnitt)