AI BENCHY
Advertise here

Categoría AI BENCHY

Ranking de Resolución de acertijos

Mira qué modelos de IA rinden mejor en Resolución de acertijos, cuáles se mantienen fiables y dónde aparecen las mayores diferencias.

Modelos mostrados

15

Promedio de Puntuación de Resolución de acertijos

6.7

Rango Modelo Empresa Puntuación de Resolución de acertijos Puntuación Pruebas correctas Tiempo de respuesta (promedio)
#117 Qwen3.5-35B-A3B none Qwen 3.7 5.6 0/3 1.35s
#119 Cobuddy medium Baidu 3.6 5.6 0/3 12.8s
#151 Trinity Large Preview none Arcee AI 3.6 4.6 0/3 1.97s
#128 Qwen3.6 Flash none Qwen 3.5 5.4 0/3 1.21s
#147 GPT-4o-mini none OpenAI 3.5 4.8 0/3 1.21s
#132 Mistral Small 4 medium Mistral 3.4 5.3 0/3 2.17s
#153 Qwen3.6 35B A3B none Qwen 3.2 4.6 0/3 1.07s
#154 Qwen3.5-9B none Qwen 3.2 4.6 0/3 621ms
#163 Granite 4.1 8B none IBM Granite 3.2 4.0 0/3 608ms
#124 Kimi K2.6 none Moonshot AI 3.1 5.5 0/3 1.40s
#142 Mistral Small 4 none Mistral 3.1 4.9 0/3 399ms
#108 Qwen3.5-Flash none Qwen 3.1 5.8 0/3 10.9s
#155 Mercury 2 none Inception 3.1 4.5 0/3 535ms
#156 Hy3 preview none Tencent 3.1 4.4 0/3 4.56s
#159 Ling-2.6-1T none Inclusionai 3.1 4.3 0/3 5.36s

Mejores modelos por Puntuación de Resolución de acertijos

Puntuación de Resolución de acertijos vs costo total

Mejores modelos por Tiempo de respuesta (promedio)