AI BENCHY
Your ad here

Fallos AI BENCHY

Fallos por Tiempo agotado

Mira qué modelos de IA se encuentran con Tiempo agotado con más frecuencia para detectar riesgos de fiabilidad antes de elegir. Ordenar por: Puntuación ↑.

Modelos mostrados

15

Fallos totales

61

Modelo más afectado

Qwen3.5-9B 11
Rango Modelo Empresa Cantidad de Tiempo agotado Puntuación Pruebas correctas Tiempo de respuesta (promedio)
#97 Qwen3.5-9B medium Qwen 11 4.4 3/18 73.6s
#93 GLM 4.7 Flash medium Z.ai 1 4.6 4/18 32.3s
#92 Qwen3 Coder Next medium Qwen 1 4.7 3/18 10.8s
#80 MiniMax M2.7 medium Minimax 2 5.3 4/18 31.1s
#71 MiniMax M2.5 medium Minimax 4 5.7 5/18 39.6s
#60 Gemma 4 26B A4B none Google 1 6.2 7/18 6.59s
#57 GPT-5 Nano medium OpenAI 1 6.3 7/18 44.1s
#52 Grok 4.1 Fast medium X AI 1 6.7 9/18 23.9s
#51 Nemotron 3 Super medium NVIDIA 1 6.7 9/18 19.1s
#50 Hunter Alpha medium OpenRouter 2 6.7 8/18 10.3s
#46 Kimi K2.5 medium Moonshot AI 2 7.0 9/18 72.4s
#45 GPT-5 Mini medium OpenAI 1 7.0 9/18 24.0s
#43 Qwen3.5-35B-A3B medium Qwen 4 7.4 10/18 44.5s
#41 MiMo-V2-Flash medium Xiaomi 1 7.5 11/18 23.4s
#40 GPT-5.2 medium OpenAI 1 7.5 11/18 14.0s

Mejores modelos por Cantidad de Tiempo agotado

Cantidad de Tiempo agotado vs Puntuación

Mejores modelos por Tiempo de respuesta (promedio)