AI BENCHY
Your ad here

Fallos AI BENCHY

Fallos por Tiempo agotado

Mira qué modelos de IA se encuentran con Tiempo agotado con más frecuencia para detectar riesgos de fiabilidad antes de elegir. Ordenar por: Puntuación ↑.

Modelos mostrados

15

Fallos totales

61

Modelo más afectado

Qwen3.5-9B 11
Rango Modelo Empresa Cantidad de Tiempo agotado Puntuación Pruebas correctas Tiempo de respuesta (promedio)
#39 Seed-2.0-Mini medium Bytedance Seed 4 7.5 11/18 69.7s
#34 Kimi K2.6 medium Moonshot AI 2 7.7 11/18 45.2s
#33 GLM 5.1 medium Z.ai 2 7.8 12/18 24.1s
#32 Qwen3.5-Flash medium Qwen 4 7.8 11/18 66.7s
#27 DeepSeek V3.2 medium DeepSeek 2 8.0 12/18 46.4s
#26 Claude Sonnet 4.6 medium Anthropic 1 8.0 13/18 12.7s
#24 Gemma 4 26B A4B medium Google 2 8.0 13/18 25.0s
#23 MiMo-V2-Pro medium Xiaomi 1 8.1 12/18 12.3s
#19 Qwen3.5-122B-A10B medium Qwen 2 8.1 13/18 31.4s
#18 GLM 5 Turbo medium Z.ai 1 8.1 12/18 17.7s
#14 Gemma 4 31B medium Google 1 8.3 13/18 24.9s
#13 GLM 5 medium Z.ai 1 8.4 13/18 23.3s
#10 Qwen3.5-27B medium Qwen 1 8.4 13/18 53.0s
#8 Qwen3.5 Plus 2026-02-15 medium Qwen 2 8.5 14/18 46.6s
#3 Claude Opus 4.7 medium Anthropic 1 9.2 16/18 3.53s

Mejores modelos por Cantidad de Tiempo agotado

Cantidad de Tiempo agotado vs Puntuación

Mejores modelos por Tiempo de respuesta (promedio)