AI BENCHY
Advertise here

Categoría AI BENCHY

Ranking de Resolución de acertijos

Mira qué modelos de IA rinden mejor en Resolución de acertijos, cuáles se mantienen fiables y dónde aparecen las mayores diferencias. Ordenar por: Tiempo de respuesta (promedio) ↓.

Modelos mostrados

15

Promedio de Puntuación de Resolución de acertijos

6.7

Mejor modelo

Qwen3.6 27B 7.7
Rango Modelo Empresa Puntuación de Resolución de acertijos Puntuación Pruebas correctas Tiempo de respuesta (promedio)
#46 Qwen3.6 35B A3B medium Qwen 8.0 7.4 2/3 5.95s
#42 GPT-5.2 medium OpenAI 7.5 7.5 2/3 5.80s
#37 Gemma 4 26B A4B medium Google 10.0 7.6 3/3 5.79s
#16 Gemini 3 Flash Preview low Google 10.0 8.4 3/3 5.77s
#159 Ling-2.6-1T none Inclusionai 3.1 4.3 0/3 5.36s
#79 Hunter Alpha medium OpenRouter 6.1 6.7 1/3 5.35s
#43 MiMo-V2.5-Pro medium Xiaomi 6.7 7.5 1/3 5.31s
#52 Claude Sonnet 4.6 medium Anthropic 10.0 7.4 3/3 5.31s
#40 Gemini 3.1 Flash Lite Preview medium Google 7.7 7.5 2/3 5.30s
#23 GLM 5 Turbo medium Z.ai 8.7 8.0 2/3 5.23s
#84 Grok 4.20 Multi Agent Beta medium X AI 6.7 6.6 1/3 5.19s
#118 Qwen3.6 27B none Qwen 5.3 5.6 1/3 5.15s
#51 Mimo V2 PRO medium Xiaomi 6.4 7.4 1/3 5.08s
#15 GPT-5.3-Codex medium OpenAI 9.0 8.4 2/3 5.05s
#6 GPT-5.5 low OpenAI 10.0 9.0 3/3 4.74s

Mejores modelos por Puntuación de Resolución de acertijos

Puntuación de Resolución de acertijos vs costo total

Mejores modelos por Tiempo de respuesta (promedio)