AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

Categoría AI BENCHY

Ranking de Resolución de acertijos

Mira qué modelos de IA rinden mejor en Resolución de acertijos, cuáles se mantienen fiables y dónde aparecen las mayores diferencias. Ordenar por: Tiempo de respuesta (promedio) ↓.

Modelos mostrados

15

Promedio de Puntuación de Resolución de acertijos

6.7

Mejor modelo

Qwen3.6 27B 7.7
Rango Modelo Empresa Puntuación de Resolución de acertijos Puntuación Pruebas correctas Tiempo de respuesta (promedio)
#128 Qwen3.6 Flash none Qwen 3.5 5.4 0/3 1.21s
#147 GPT-4o-mini none OpenAI 3.5 4.8 0/3 1.21s
#122 GLM 4.7 Flash none Z.ai 6.4 5.5 1/3 1.20s
#101 Mimo V2 Omni none Xiaomi 10.0 6.0 3/3 1.16s
#34 Qwen3.7 Max none Qwen 10.0 7.7 3/3 1.13s
#157 Grok 4.1 Fast none X AI 3.0 4.4 0/3 1.10s
#153 Qwen3.6 35B A3B none Qwen 3.2 4.6 0/3 1.07s
#104 Nemotron 3 Ultra 550b A55b none NVIDIA 5.9 6.0 1/3 1.06s
#48 Gemini 3 Flash Preview none Google 7.7 7.4 2/3 1.05s
#131 Qwen3.5-122B-A10B none Qwen 3.8 5.3 0/3 1.00s
#81 Mercury 2 medium Inception 5.4 6.6 1/3 949ms
#58 Gemini 3.1 Flash Lite Preview none Google 10.0 7.2 3/3 900ms
#145 Laguna M.1 none Poolside 3.0 4.8 0/3 891ms
#136 Elephant Alpha medium Openrouter 5.3 5.1 1/3 868ms
#144 GPT-5.4 Mini none OpenAI 5.4 4.9 1/3 836ms

Mejores modelos por Puntuación de Resolución de acertijos

Puntuación de Resolución de acertijos vs costo total

Mejores modelos por Tiempo de respuesta (promedio)