AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

Categoría AI BENCHY

Ranking de Resolución de acertijos

Mira qué modelos de IA rinden mejor en Resolución de acertijos, cuáles se mantienen fiables y dónde aparecen las mayores diferencias. Ordenar por: Tiempo de respuesta (promedio) ↓.

Modelos mostrados

15

Promedio de Puntuación de Resolución de acertijos

6.7

Mejor modelo

Qwen3.6 27B 7.7
Rango Modelo Empresa Puntuación de Resolución de acertijos Puntuación Pruebas correctas Tiempo de respuesta (promedio)
#88 Qwen3.7 Plus none Qwen 7.7 6.4 2/3 1.71s
#50 Gemini 3.1 Flash Lite Preview low Google 10.0 7.4 3/3 1.69s
#120 Mimo V2 PRO none Xiaomi 6.0 5.6 1/3 1.61s
#112 GLM 5.1 none Z.ai 7.7 5.7 2/3 1.45s
#32 Gemini 3.5 Flash minimal Google 10.0 7.7 3/3 1.45s
#125 GPT-5.4 none OpenAI 5.6 5.5 1/3 1.44s
#61 Gemini 3.1 Flash Lite low Google 10.0 7.2 3/3 1.40s
#124 Kimi K2.6 none Moonshot AI 3.1 5.5 0/3 1.40s
#149 Nemotron 3 Nano Omni 30b A3b Reasoning medium NVIDIA 2.9 4.6 0/3 1.40s
#115 Qwen3.5-27B none Qwen 6.7 5.7 1/3 1.38s
#117 Qwen3.5-35B-A3B none Qwen 3.7 5.6 0/3 1.35s
#123 MiMo-V2.5-Pro none Xiaomi 6.7 5.5 1/3 1.30s
#91 GPT-5.5 none OpenAI 7.7 6.4 2/3 1.29s
#148 GPT-5.4 Nano none OpenAI 5.4 4.7 1/3 1.25s
#150 Qwen3 Coder Next medium Qwen 3.0 4.6 0/3 1.25s

Mejores modelos por Puntuación de Resolución de acertijos

Puntuación de Resolución de acertijos vs costo total

Mejores modelos por Tiempo de respuesta (promedio)