AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

Fallos AI BENCHY

Fallos por Tiempo agotado

Mira qué modelos de IA se encuentran con Tiempo agotado con más frecuencia para detectar riesgos de fiabilidad antes de elegir. Ordenar por: Pruebas correctas ↑.

Modelos mostrados

4

Fallos totales

73

Modelo más afectado

Qwen3.5-9B 11
Rango Modelo Empresa Cantidad de Tiempo agotado Puntuación Pruebas correctas Tiempo de respuesta (promedio)
#37 Gemma 4 26B A4B medium Google 2 7.6 14/21 63.4s
#17 GLM 5 medium Z.ai 1 8.3 15/21 33.5s
#18 Qwen3.7 Plus medium Qwen 1 8.2 15/21 38.9s
#11 Claude Opus 4.7 medium Anthropic 1 8.7 17/21 4.73s

Mejores modelos por Cantidad de Tiempo agotado

Cantidad de Tiempo agotado vs Puntuación

Mejores modelos por Tiempo de respuesta (promedio)