AI BENCHY
Advertise here

Fallos AI BENCHY

Fallos por Tiempo agotado

Mira qué modelos de IA se encuentran con Tiempo agotado con más frecuencia para detectar riesgos de fiabilidad antes de elegir. Ordenar por: Puntuación ↑.

Modelos mostrados

15

Fallos totales

73

Modelo más afectado

Qwen3.5-9B 11
Rango Modelo Empresa Cantidad de Tiempo agotado Puntuación Pruebas correctas Tiempo de respuesta (promedio)
#66 Qwen3.5-35B-A3B medium Qwen 5 7.1 11/21 72.6s
#64 MiMo-V2-Flash medium Xiaomi 1 7.2 12/21 20.1s
#62 Step 3.5 Flash medium Stepfun 1 7.2 11/20 72.5s
#60 Kimi K2.6 medium Moonshot AI 3 7.2 12/21 71.7s
#55 GLM 5.1 medium Z.ai 2 7.3 12/21 33.7s
#54 GPT-5 Mini medium OpenAI 1 7.3 12/21 23.6s
#52 Claude Sonnet 4.6 medium Anthropic 1 7.4 13/21 17.1s
#51 Mimo V2 PRO medium Xiaomi 1 7.4 12/21 22.2s
#49 Qwen3.5-Flash medium Qwen 3 7.4 12/21 63.3s
#42 GPT-5.2 medium OpenAI 1 7.5 13/21 16.9s
#37 Gemma 4 26B A4B medium Google 2 7.6 14/21 63.4s
#30 Qwen3.5-27B medium Qwen 1 7.8 13/21 68.4s
#29 Qwen3.5-122B-A10B medium Qwen 2 7.8 14/21 42.5s
#27 Gemma 4 31B medium Google 2 7.8 14/21 56.5s
#25 Qwen3.5 Plus 2026-02-15 medium Qwen 2 7.9 14/21 73.8s

Mejores modelos por Cantidad de Tiempo agotado

Cantidad de Tiempo agotado vs Puntuación

Mejores modelos por Tiempo de respuesta (promedio)