AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

Categoría AI BENCHY

Ranking de Resolución de acertijos

Mira qué modelos de IA rinden mejor en Resolución de acertijos, cuáles se mantienen fiables y dónde aparecen las mayores diferencias. Ordenar por: Tiempo de respuesta (promedio) ↓.

Modelos mostrados

15

Promedio de Puntuación de Resolución de acertijos

6.7

Mejor modelo

Qwen3.6 27B 7.7
Rango Modelo Empresa Puntuación de Resolución de acertijos Puntuación Pruebas correctas Tiempo de respuesta (promedio)
#7 Gemini 3.5 Flash medium Google 7.7 9.0 2/3 2.38s
#80 Mimo V2 Omni medium Xiaomi 5.9 6.7 1/3 2.38s
#141 Nemotron 3 Super none NVIDIA 5.5 4.9 1/3 2.36s
#3 Gemini 3.5 Flash low Google 10.0 9.4 3/3 2.35s
#132 Mistral Small 4 medium Mistral 3.4 5.3 0/3 2.17s
#87 Gemini 3.1 Flash Lite minimal Google 6.0 6.4 1/3 2.15s
#143 MiMo-V2.5 none Xiaomi 5.4 4.9 1/3 2.13s
#114 Qwen3.5 Plus 2026-04-20 none Qwen 6.7 5.7 1/3 1.97s
#151 Trinity Large Preview none Arcee AI 3.6 4.6 0/3 1.97s
#44 Gemini 3.1 Flash Lite medium Google 7.6 7.5 2/3 1.95s
#107 Laguna Xs.2 medium Poolside 5.3 5.8 1/3 1.93s
#98 GLM 5 none Z.ai 7.7 6.1 2/3 1.91s
#152 MiMo-V2-Flash none Xiaomi 5.3 4.6 1/3 1.86s
#57 Step 3.7 Flash low Stepfun 5.5 7.3 1/3 1.84s
#160 LFM2-24B-A2B none Liquid 3.8 4.2 0/3 1.78s

Mejores modelos por Puntuación de Resolución de acertijos

Puntuación de Resolución de acertijos vs costo total

Mejores modelos por Tiempo de respuesta (promedio)