AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

Categoría AI BENCHY

Ranking de Resolución de acertijos

Mira qué modelos de IA rinden mejor en Resolución de acertijos, cuáles se mantienen fiables y dónde aparecen las mayores diferencias. Ordenar por: Tiempo de respuesta (promedio) ↓.

Modelos mostrados

15

Promedio de Puntuación de Resolución de acertijos

6.7

Mejor modelo

Qwen3.6 27B 7.7
Rango Modelo Empresa Puntuación de Resolución de acertijos Puntuación Pruebas correctas Tiempo de respuesta (promedio)
#69 Claude Opus 4.6 medium Anthropic 7.7 7.0 2/3 4.71s
#156 Hy3 preview none Tencent 3.1 4.4 0/3 4.56s
#45 GPT-5.4 Mini medium OpenAI 7.8 7.5 2/3 4.37s
#85 Gemma 4 31B none Google 6.5 6.5 1/3 4.23s
#121 Owl Alpha none Openrouter 5.4 5.5 1/3 4.18s
#24 GPT-5.2 Chat none OpenAI 7.7 7.9 2/3 4.10s
#1 Gemini 3 Flash Preview medium Google 10.0 9.8 3/3 4.05s
#135 Kimi K2.5 none Moonshot AI 3.0 5.2 0/3 4.04s
#10 Claude Opus 4.8 medium Anthropic 10.0 8.7 3/3 3.95s
#35 Gemini 3 PRO Preview medium Google 10.0 7.6 3/3 3.88s
#64 MiMo-V2-Flash medium Xiaomi 7.7 7.2 2/3 3.87s
#70 GPT-5.4 Nano medium OpenAI 4.1 7.0 0/3 3.79s
#116 Hunter Alpha none OpenRouter 5.8 5.7 1/3 3.71s
#41 Nemotron 3 Ultra 550b A55b medium NVIDIA 5.5 7.5 1/3 3.54s
#13 Grok 4.20 Beta medium X AI 10.0 8.5 3/3 3.52s

Mejores modelos por Puntuación de Resolución de acertijos

Puntuación de Resolución de acertijos vs costo total

Mejores modelos por Tiempo de respuesta (promedio)