AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

Categoría AI BENCHY

Ranking de Resolución de acertijos

Mira qué modelos de IA rinden mejor en Resolución de acertijos, cuáles se mantienen fiables y dónde aparecen las mayores diferencias.

Modelos mostrados

15

Promedio de Puntuación de Resolución de acertijos

6.7

Rango Modelo Empresa Puntuación de Resolución de acertijos Puntuación Pruebas correctas Tiempo de respuesta (promedio)
#136 Elephant Alpha medium Openrouter 5.3 5.1 1/3 868ms
#146 Laguna Xs.2 none Poolside 5.3 4.8 1/3 650ms
#152 MiMo-V2-Flash none Xiaomi 5.3 4.6 1/3 1.86s
#71 Step 3.7 Flash high Stepfun 5.3 7.0 1/3 10.2s
#86 Grok 4.1 Fast medium X AI 5.3 6.5 1/3 7.40s
#94 GPT-5 Nano medium OpenAI 5.3 6.3 1/3 20.6s
#99 gpt-oss-120b medium OpenAI 5.3 6.1 1/3 21.7s
#110 Seed-2.0-Lite none Bytedance Seed 5.3 5.8 1/3 2.78s
#111 Owl Alpha medium Openrouter 5.3 5.7 1/3 3.40s
#118 Qwen3.6 27B none Qwen 5.3 5.6 1/3 5.15s
#129 MiniMax M2.5 medium Minimax 5.3 5.3 1/3 11.2s
#137 Elephant Alpha none Openrouter 4.2 5.1 0/3 807ms
#70 GPT-5.4 Nano medium OpenAI 4.1 7.0 0/3 3.79s
#131 Qwen3.5-122B-A10B none Qwen 3.8 5.3 0/3 1.00s
#160 LFM2-24B-A2B none Liquid 3.8 4.2 0/3 1.78s

Mejores modelos por Puntuación de Resolución de acertijos

Puntuación de Resolución de acertijos vs costo total

Mejores modelos por Tiempo de respuesta (promedio)