AI BENCHY
Your ad here

Categoría AI BENCHY

Ranking de Resolución de acertijos

Mira qué modelos de IA rinden mejor en Resolución de acertijos, cuáles se mantienen fiables y dónde aparecen las mayores diferencias. Ordenar por: Métrica ↑.

Modelos mostrados

15

Promedio de Puntuación de Resolución de acertijos

6.4

Mejor modelo

GLM 4.7 Flash 2.9
Rango Modelo Empresa Puntuación de Resolución de acertijos Puntuación Pruebas correctas Tiempo de respuesta (promedio)
#15 Gemini 2.5 Flash medium Google 7.7 8.2 2/3 3.94s
#17 Gemini 3.1 Flash Lite Preview medium Google 7.7 8.2 2/3 3.58s
#21 Gemini 3 Flash Preview none Google 7.7 8.1 2/3 1.06s
#28 GPT-5.2 Chat none OpenAI 7.7 7.9 2/3 4.42s
#37 Claude Opus 4.6 medium Anthropic 7.7 7.6 2/3 4.60s
#41 MiMo-V2-Flash medium Xiaomi 7.7 7.5 2/3 3.77s
#42 Claude Sonnet 4.6 none Anthropic 7.7 7.4 2/3 2.92s
#49 Qwen3.5 Plus 2026-02-15 none Qwen 7.7 6.8 2/3 2.82s
#53 GLM 5 none Z.ai 7.7 6.6 2/3 2.05s
#31 GLM 5V Turbo medium Z.ai 7.7 7.8 2/3 10.9s
#40 GPT-5.2 medium OpenAI 7.7 7.5 2/3 5.47s
#24 Gemma 4 26B A4B medium Google 7.9 8.0 2/3 8.52s
#55 MiMo-V2-Omni none Xiaomi 8.0 6.5 2/3 2.71s
#10 Qwen3.5-27B medium Qwen 8.2 8.4 2/3 64.6s
#16 GPT-5.4 medium OpenAI 8.2 8.2 2/3 9.13s

Mejores modelos por Puntuación de Resolución de acertijos

Puntuación de Resolución de acertijos vs costo total

Mejores modelos por Tiempo de respuesta (promedio)