AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

Categoría AI BENCHY

Ranking de Resolución de acertijos

Mira qué modelos de IA rinden mejor en Resolución de acertijos, cuáles se mantienen fiables y dónde aparecen las mayores diferencias.

Modelos mostrados

15

Promedio de Puntuación de Resolución de acertijos

6.4

Rango Modelo Empresa Puntuación de Resolución de acertijos Puntuación Pruebas correctas Tiempo de respuesta (promedio)
#6 Seed-2.0-Lite medium Bytedance Seed 9.0 8.6 2/3 11.0s
#7 GPT-5.3-Codex medium OpenAI 9.0 8.6 2/3 5.12s
#14 Gemma 4 31B medium Google 8.8 8.3 2/3 27.6s
#64 DeepSeek V3.2 none DeepSeek 8.5 6.1 2/3 7.37s
#16 GPT-5.4 medium OpenAI 8.2 8.2 2/3 9.13s
#25 Grok 4.20 Beta medium X AI 8.2 8.0 2/3 3.85s
#27 DeepSeek V3.2 medium DeepSeek 8.2 8.0 2/3 36.9s
#33 GLM 5.1 medium Z.ai 8.2 7.8 2/3 23.8s
#39 Seed-2.0-Mini medium Bytedance Seed 8.2 7.5 2/3 25.9s
#10 Qwen3.5-27B medium Qwen 8.2 8.4 2/3 64.6s
#55 MiMo-V2-Omni none Xiaomi 8.0 6.5 2/3 2.71s
#24 Gemma 4 26B A4B medium Google 7.9 8.0 2/3 8.52s
#31 GLM 5V Turbo medium Z.ai 7.7 7.8 2/3 10.9s
#40 GPT-5.2 medium OpenAI 7.7 7.5 2/3 5.47s
#11 Gemini 3.1 Flash Lite Preview high Google 7.7 8.4 2/3 46.3s

Mejores modelos por Puntuación de Resolución de acertijos

Puntuación de Resolución de acertijos vs costo total

Mejores modelos por Tiempo de respuesta (promedio)