Fallos por categoría de AI BENCHY
Específico del dominio: Tiempo agotado
Específico del dominio
Tiempo agotado
Mira qué modelos de IA tienen más probabilidades de caer en Tiempo agotado dentro de Específico del dominio, para detectar puntos débiles más rápido. Ordenar por: Tiempo de respuesta (promedio) ↑.
Motivos de fallo
| Rango | Modelo | Empresa | Cantidad de Tiempo agotado | Puntuación de categoría | Pruebas correctas | Tiempo de respuesta (promedio) |
|---|---|---|---|---|---|---|
| #13 | GLM 5 medium | Z.ai | 1 | 3.5 | 0/3 | 0ms |
| #26 | Claude Sonnet 4.6 medium | Anthropic | 1 | 2.9 | 0/3 | 0ms |
| #39 | Seed-2.0-Mini medium | Bytedance Seed | 3 | 3.0 | 0/3 | 0ms |
| #3 | Claude Opus 4.7 medium | Anthropic | 1 | 7.7 | 2/3 | 1.17s |
| #23 | MiMo-V2-Pro medium | Xiaomi | 1 | 5.3 | 1/3 | 6.00s |
| #50 | Hunter Alpha medium | OpenRouter | 1 | 3.0 | 0/3 | 10.5s |
| #51 | Nemotron 3 Super medium | NVIDIA | 1 | 2.9 | 0/3 | 16.2s |
| #8 | Qwen3.5 Plus 2026-02-15 medium | Qwen | 1 | 5.3 | 1/3 | 17.5s |
| #80 | MiniMax M2.7 medium | Minimax | 2 | 3.0 | 0/3 | 19.0s |
| #24 | Gemma 4 26B A4B medium | 1 | 2.9 | 0/3 | 23.6s | |
| #33 | GLM 5.1 medium | Z.ai | 1 | 5.3 | 1/3 | 29.8s |
| #27 | DeepSeek V3.2 medium | DeepSeek | 1 | 5.3 | 1/3 | 39.3s |
| #45 | GPT-5 Mini medium | OpenAI | 1 | 3.6 | 0/3 | 44.6s |
| #18 | GLM 5 Turbo medium | Z.ai | 1 | 2.9 | 0/3 | 71.1s |
| #40 | GPT-5.2 medium | OpenAI | 1 | 5.9 | 1/3 | 77.8s |