Fallos por categoría de AI BENCHY
Resolución de acertijos
Tiempo agotado
Resolución de acertijos
Tiempo agotado
Mira qué modelos de IA tienen más probabilidades de caer en Tiempo agotado dentro de Resolución de acertijos, para detectar puntos débiles más rápido.
Motivos de fallo relacionados
Categorías relacionadas
| Rango | Modelo | Empresa | Cantidad de Tiempo agotado | Puntuación de categoría | Pruebas correctas | Tiempo de respuesta (promedio) |
|---|---|---|---|---|---|---|
| #24 | Qwen3.5-Flash medium | Qwen | 2 | 4.0 | 1/3 | 56.7s |
| #35 | Qwen3.5-35B-A3B medium | Qwen | 1 | 4.0 | 1/3 | 31.6s |
| #43 | MiniMax M2.5 medium | Minimax | 1 | 4.0 | 1/3 | 11.5s |