AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

Categoría AI BENCHY

Ranking de Resolución de acertijos

Mira qué modelos de IA rinden mejor en Resolución de acertijos, cuáles se mantienen fiables y dónde aparecen las mayores diferencias. Ordenar por: Tiempo de respuesta (promedio) ↑.

Modelos mostrados

15

Promedio de Puntuación de Resolución de acertijos

6.4

Mejor modelo

Grok 4.20 5.3
Rango Modelo Empresa Puntuación de Resolución de acertijos Puntuación Pruebas correctas Tiempo de respuesta (promedio)
#31 GLM 5V Turbo medium Z.ai 7.7 7.8 2/3 10.9s
#6 Seed-2.0-Lite medium Bytedance Seed 9.0 8.6 2/3 11.0s
#71 MiniMax M2.5 medium Minimax 5.3 5.7 1/3 11.5s
#68 gpt-oss-120b medium OpenAI 3.2 5.8 0/3 11.8s
#93 GLM 4.7 Flash medium Z.ai 2.9 4.6 0/3 12.9s
#45 GPT-5 Mini medium OpenAI 5.6 7.0 1/3 14.1s
#13 GLM 5 medium Z.ai 10.0 8.4 3/3 15.6s
#19 Qwen3.5-122B-A10B medium Qwen 10.0 8.1 3/3 17.2s
#57 GPT-5 Nano medium OpenAI 5.3 6.3 1/3 19.8s
#87 Qwen3 Coder Next none Qwen 3.2 5.1 0/3 22.9s
#33 GLM 5.1 medium Z.ai 8.2 7.8 2/3 23.8s
#34 Kimi K2.6 medium Moonshot AI 5.0 7.7 0/3 25.6s
#80 MiniMax M2.7 medium Minimax 3.8 5.3 0/3 25.6s
#39 Seed-2.0-Mini medium Bytedance Seed 8.2 7.5 2/3 25.9s
#14 Gemma 4 31B medium Google 8.8 8.3 2/3 27.6s

Mejores modelos por Puntuación de Resolución de acertijos

Puntuación de Resolución de acertijos vs costo total

Mejores modelos por Tiempo de respuesta (promedio)