AI BENCHY
Your ad here

Fallos por categoría de AI BENCHY

Específico del dominio: Tiempo agotado

Específico del dominio
Tiempo agotado

Mira qué modelos de IA tienen más probabilidades de caer en Tiempo agotado dentro de Específico del dominio, para detectar puntos débiles más rápido. Ordenar por: Pruebas correctas ↑.

Modelos mostrados

15

Fallos totales

31

Modelo más afectado

GLM 5 1
Rango Modelo Empresa Cantidad de Tiempo agotado Puntuación de categoría Pruebas correctas Tiempo de respuesta (promedio)
#13 GLM 5 medium Z.ai 1 3.5 0/3 0ms
#18 GLM 5 Turbo medium Z.ai 1 2.9 0/3 71.1s
#24 Gemma 4 26B A4B medium Google 1 2.9 0/3 23.6s
#26 Claude Sonnet 4.6 medium Anthropic 1 2.9 0/3 0ms
#39 Seed-2.0-Mini medium Bytedance Seed 3 3.0 0/3 0ms
#43 Qwen3.5-35B-A3B medium Qwen 2 4.1 0/3 88.3s
#45 GPT-5 Mini medium OpenAI 1 3.6 0/3 44.6s
#46 Kimi K2.5 medium Moonshot AI 1 3.5 0/3 137.3s
#50 Hunter Alpha medium OpenRouter 1 3.0 0/3 10.5s
#51 Nemotron 3 Super medium NVIDIA 1 2.9 0/3 16.2s
#71 MiniMax M2.5 medium Minimax 1 2.9 0/3 237.3s
#80 MiniMax M2.7 medium Minimax 2 3.0 0/3 19.0s
#97 Qwen3.5-9B medium Qwen 3 3.6 0/3 137.7s
#8 Qwen3.5 Plus 2026-02-15 medium Qwen 1 5.3 1/3 17.5s
#10 Qwen3.5-27B medium Qwen 1 5.3 1/3 79.5s

Mejores modelos por Cantidad de Tiempo agotado

Cantidad de Tiempo agotado vs Puntuación

Mejores modelos por Tiempo de respuesta (promedio)

Mejores modelos por Costo desperdiciado estimado