AI BENCHY
Your ad here

Categoría AI BENCHY

Ranking de Resolución de acertijos

Mira qué modelos de IA rinden mejor en Resolución de acertijos, cuáles se mantienen fiables y dónde aparecen las mayores diferencias. Ordenar por: Tiempo de respuesta (promedio) ↑.

Modelos mostrados

15

Promedio de Puntuación de Resolución de acertijos

6.4

Mejor modelo

Grok 4.20 5.3
Rango Modelo Empresa Puntuación de Resolución de acertijos Puntuación Pruebas correctas Tiempo de respuesta (promedio)
#95 Grok 4.1 Fast none X AI 3.2 4.5 0/3 1.28s
#96 GPT-5.4 Nano none OpenAI 3.7 4.5 0/3 1.29s
#89 GPT-4o-mini none OpenAI 3.7 4.9 0/3 1.30s
#63 Qwen3.5-35B-A3B none Qwen 3.9 6.1 0/3 1.34s
#67 Qwen3.5-27B none Qwen 6.7 5.9 1/3 1.37s
#94 MiMo-V2-Flash none Xiaomi 3.6 4.5 0/3 1.38s
#75 GLM 5.1 none Z.ai 5.7 5.6 1/3 1.48s
#66 GPT-5.4 none OpenAI 5.6 5.9 1/3 1.52s
#69 Kimi K2.6 none Moonshot AI 3.4 5.8 0/3 1.66s
#98 LFM2-24B-A2B none Liquid 4.4 4.1 0/3 1.69s
#65 MiMo-V2-Pro none Xiaomi 6.0 6.0 1/3 1.83s
#73 Mistral Small 4 medium Mistral 3.4 5.7 0/3 2.00s
#53 GLM 5 none Z.ai 7.7 6.6 2/3 2.05s
#58 GLM 5V Turbo none Z.ai 5.3 6.2 1/3 2.22s
#92 Qwen3 Coder Next medium Qwen 3.1 4.7 0/3 2.30s

Mejores modelos por Puntuación de Resolución de acertijos

Puntuación de Resolución de acertijos vs costo total

Mejores modelos por Tiempo de respuesta (promedio)