AI BENCHY
Advertise here

Categoría AI BENCHY

Ranking de Resolución de acertijos

Mira qué modelos de IA rinden mejor en Resolución de acertijos, cuáles se mantienen fiables y dónde aparecen las mayores diferencias. Ordenar por: Tiempo de respuesta (promedio) ↓.

Modelos mostrados

15

Promedio de Puntuación de Resolución de acertijos

6.7

Mejor modelo

Qwen3.6 27B 7.7
Rango Modelo Empresa Puntuación de Resolución de acertijos Puntuación Pruebas correctas Tiempo de respuesta (promedio)
#49 Qwen3.5-Flash medium Qwen 8.2 7.4 2/3 27.6s
#27 Gemma 4 31B medium Google 9.9 7.8 3/3 26.9s
#31 DeepSeek V4 Flash high DeepSeek 8.2 7.7 2/3 26.1s
#60 Kimi K2.6 medium Moonshot AI 6.0 7.2 1/3 25.1s
#130 MiniMax M2.7 medium Minimax 5.9 5.3 1/3 24.9s
#140 Qwen3 Coder Next none Qwen 3.0 4.9 0/3 24.3s
#14 Qwen3.6 Max Preview medium Qwen 10.0 8.5 3/3 24.3s
#139 DeepSeek V4 Flash none DeepSeek 3.1 5.0 0/3 23.7s
#38 Grok 4.3 medium X AI 5.9 7.6 1/3 22.5s
#99 gpt-oss-120b medium OpenAI 5.3 6.1 1/3 21.7s
#75 Ring-2.6-1T medium Inclusionai 5.9 6.9 1/3 20.7s
#94 GPT-5 Nano medium OpenAI 5.3 6.3 1/3 20.6s
#56 MiMo-V2.5 medium Xiaomi 8.2 7.3 2/3 20.3s
#47 Grok Build 0.1 medium X AI 7.7 7.4 2/3 18.3s
#29 Qwen3.5-122B-A10B medium Qwen 10.0 7.8 3/3 17.9s

Mejores modelos por Puntuación de Resolución de acertijos

Puntuación de Resolución de acertijos vs costo total

Mejores modelos por Tiempo de respuesta (promedio)