Modell-Ranking für Rätsellösen

AI BENCHY Kategorie

Sieh, welche KI-Modelle bei Rätsellösen am besten abschneiden, welche zuverlässig bleiben und wo die größten Unterschiede liegen. Sortieren nach: Metrik ↑.

Angezeigte Modelle

Durchschnittlicher Wert für Rätsellösen-Score

6.7

Bestes Modell

Ling-2.6-flash 2.9

Fehlergründe

Mit Fehlergrund Falsche Antwort147 Mit Fehlergrund Anweisungen nicht befolgt78 Mit Fehlergrund API-Fehler13 Mit Fehlergrund Zeitüberschreitung5 Mit Fehlergrund Zusätzliche Formatierung5 Mit Fehlergrund Keine Antwort1

Rang	Modell	Unternehmen	Rätsellösen-Score	Punktzahl	Korrekte Tests	Antwortzeit (Durchschnitt)
#137	Elephant Alpha none	Openrouter	4.2	5.1	0/3	807ms
#99	gpt-oss-120b medium	OpenAI	5.3	6.1	1/3	21.7s
#110	Seed-2.0-Lite none	Bytedance Seed	5.3	5.8	1/3	2.78s
#111	Owl Alpha medium	Openrouter	5.3	5.7	1/3	3.40s
#118	Qwen3.6 27B none	Qwen	5.3	5.6	1/3	5.15s
#129	MiniMax M2.5 medium	Minimax	5.3	5.3	1/3	11.2s
#71	Step 3.7 Flash high	Stepfun	5.3	7.0	1/3	10.2s
#86	Grok 4.1 Fast medium	X AI	5.3	6.5	1/3	7.40s
#94	GPT-5 Nano medium	OpenAI	5.3	6.3	1/3	20.6s
#62	Step 3.5 Flash medium	Stepfun	5.3	7.2	1/3	7.22s
#89	Hy3 preview low	Tencent	5.3	6.4	1/3	7.51s
#92	Laguna M.1 medium	Poolside	5.3	6.4	1/3	10.2s
#93	Qwen3.6 Plus Preview medium	Qwen	5.3	6.3	1/3	7.52s
#107	Laguna Xs.2 medium	Poolside	5.3	5.8	1/3	1.93s
#109	GLM 5V Turbo none	Z.ai	5.3	5.8	1/3	2.40s

Rätsellösen-Ranking

Top-Modelle nach Rätsellösen-Score

Rätsellösen-Score vs. Gesamtkosten

Top-Modelle nach Antwortzeit (Durchschnitt)