Modell-Ranking für Rätsellösen

AI BENCHY Kategorie

Sieh, welche KI-Modelle bei Rätsellösen am besten abschneiden, welche zuverlässig bleiben und wo die größten Unterschiede liegen. Sortieren nach: Korrekte Tests ↓.

Angezeigte Modelle

Durchschnittlicher Wert für Rätsellösen-Score

6.7

Bestes Modell

Gemini 3 Flash Preview 10.0

Fehlergründe

Mit Fehlergrund Falsche Antwort147 Mit Fehlergrund Anweisungen nicht befolgt78 Mit Fehlergrund API-Fehler13 Mit Fehlergrund Zeitüberschreitung5 Mit Fehlergrund Zusätzliche Formatierung5 Mit Fehlergrund Keine Antwort1

Rang	Modell	Unternehmen	Rätsellösen-Score	Punktzahl	Korrekte Tests	Antwortzeit (Durchschnitt)
#127	Grok 4.20 none	X AI	5.3	5.4	1/3	473ms
#129	MiniMax M2.5 medium	Minimax	5.3	5.3	1/3	11.2s
#130	MiniMax M2.7 medium	Minimax	5.9	5.3	1/3	24.9s
#134	GLM 5 Turbo none	Z.ai	5.5	5.2	1/3	2.65s
#136	Elephant Alpha medium	Openrouter	5.3	5.1	1/3	868ms
#141	Nemotron 3 Super none	NVIDIA	5.5	4.9	1/3	2.36s
#143	MiMo-V2.5 none	Xiaomi	5.4	4.9	1/3	2.13s
#144	GPT-5.4 Mini none	OpenAI	5.4	4.9	1/3	836ms
#146	Laguna Xs.2 none	Poolside	5.3	4.8	1/3	650ms
#148	GPT-5.4 Nano none	OpenAI	5.4	4.7	1/3	1.25s
#152	MiMo-V2-Flash none	Xiaomi	5.3	4.6	1/3	1.86s
#70	GPT-5.4 Nano medium	OpenAI	4.1	7.0	0/3	3.79s
#105	Nemotron 3 Super medium	NVIDIA	3.0	5.8	0/3	3.15s
#108	Qwen3.5-Flash none	Qwen	3.1	5.8	0/3	10.9s
#117	Qwen3.5-35B-A3B none	Qwen	3.7	5.6	0/3	1.35s

Rätsellösen-Ranking

Top-Modelle nach Rätsellösen-Score

Rätsellösen-Score vs. Gesamtkosten

Top-Modelle nach Antwortzeit (Durchschnitt)