AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

Categoría AI BENCHY

Ranking de Resolución de acertijos

Mira qué modelos de IA rinden mejor en Resolución de acertijos, cuáles se mantienen fiables y dónde aparecen las mayores diferencias. Ordenar por: Tiempo de respuesta (promedio) ↓.

Modelos mostrados

15

Promedio de Puntuación de Resolución de acertijos

6.7

Mejor modelo

Qwen3.6 27B 7.7
Rango Modelo Empresa Puntuación de Resolución de acertijos Puntuación Pruebas correctas Tiempo de respuesta (promedio)
#36 Qwen3.5 Plus 2026-04-20 medium Qwen 8.2 7.6 2/3 17.7s
#18 Qwen3.7 Plus medium Qwen 10.0 8.2 3/3 16.4s
#113 DeepSeek V4 Pro none DeepSeek 7.6 5.7 2/3 16.0s
#54 GPT-5 Mini medium OpenAI 5.6 7.3 1/3 15.2s
#158 GLM 4.7 Flash medium Z.ai 2.9 4.4 0/3 12.9s
#119 Cobuddy medium Baidu 3.6 5.6 0/3 12.8s
#17 GLM 5 medium Z.ai 10.0 8.3 3/3 11.3s
#129 MiniMax M2.5 medium Minimax 5.3 5.3 1/3 11.2s
#33 Hy3 preview medium Tencent 7.7 7.7 2/3 11.1s
#108 Qwen3.5-Flash none Qwen 3.1 5.8 0/3 10.9s
#59 GLM 5V Turbo medium Z.ai 7.7 7.2 2/3 10.2s
#19 Seed-2.0-Lite medium Bytedance Seed 9.0 8.2 2/3 10.2s
#71 Step 3.7 Flash high Stepfun 5.3 7.0 1/3 10.2s
#92 Laguna M.1 medium Poolside 5.3 6.4 1/3 10.2s
#100 Grok Build 0.1 none X AI 6.4 6.0 1/3 9.55s

Mejores modelos por Puntuación de Resolución de acertijos

Puntuación de Resolución de acertijos vs costo total

Mejores modelos por Tiempo de respuesta (promedio)