AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

Fallos AI BENCHY

Fallos por Tiempo agotado

Mira qué modelos de IA se encuentran con Tiempo agotado con más frecuencia para detectar riesgos de fiabilidad antes de elegir. Ordenar por: Puntuación ↑.

Modelos mostrados

15

Fallos totales

73

Modelo más afectado

Qwen3.5-9B 11
Rango Modelo Empresa Cantidad de Tiempo agotado Puntuación Pruebas correctas Tiempo de respuesta (promedio)
#161 Qwen3.5-9B medium Qwen 11 4.2 3/21 82.2s
#158 GLM 4.7 Flash medium Z.ai 2 4.4 4/21 35.1s
#150 Qwen3 Coder Next medium Qwen 1 4.6 4/21 8.58s
#130 MiniMax M2.7 medium Minimax 2 5.3 5/21 38.2s
#129 MiniMax M2.5 medium Minimax 4 5.3 5/21 65.4s
#105 Nemotron 3 Super medium NVIDIA 1 5.8 8/21 32.0s
#103 DeepSeek V4 Pro high DeepSeek 3 6.0 8/21 65.2s
#102 Gemma 4 26B A4B none Google 1 6.0 8/21 5.91s
#94 GPT-5 Nano medium OpenAI 1 6.3 9/21 42.5s
#86 Grok 4.1 Fast medium X AI 1 6.5 9/19 23.8s
#79 Hunter Alpha medium OpenRouter 2 6.7 8/18 10.3s
#76 Kimi K2.5 medium Moonshot AI 2 6.8 10/21 98.4s
#73 Seed-2.0-Mini medium Bytedance Seed 5 6.9 11/21 80.2s
#72 DeepSeek V3.2 medium DeepSeek 2 7.0 11/21 68.7s
#67 MiniMax M3 medium Minimax 3 7.1 11/21 68.2s

Mejores modelos por Cantidad de Tiempo agotado

Cantidad de Tiempo agotado vs Puntuación

Mejores modelos por Tiempo de respuesta (promedio)