AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

Fallos por categoría de AI BENCHY

Específico del dominio: Tiempo agotado

Específico del dominio
Tiempo agotado

Mira qué modelos de IA tienen más probabilidades de caer en Tiempo agotado dentro de Específico del dominio, para detectar puntos débiles más rápido. Ordenar por: Tiempo de respuesta (promedio) ↑.

Modelos mostrados

15

Fallos totales

34

Modelo más afectado

GLM 5 1
Rango Modelo Empresa Cantidad de Tiempo agotado Puntuación de categoría Pruebas correctas Tiempo de respuesta (promedio)
#17 GLM 5 medium Z.ai 1 3.5 0/3 0ms
#52 Claude Sonnet 4.6 medium Anthropic 1 2.9 0/3 0ms
#73 Seed-2.0-Mini medium Bytedance Seed 3 3.0 0/3 0ms
#11 Claude Opus 4.7 medium Anthropic 1 7.7 2/3 1.17s
#51 Mimo V2 PRO medium Xiaomi 1 5.3 1/3 8.82s
#79 Hunter Alpha medium OpenRouter 1 3.0 0/3 10.5s
#105 Nemotron 3 Super medium NVIDIA 1 2.9 0/3 16.2s
#25 Qwen3.5 Plus 2026-02-15 medium Qwen 1 5.3 1/3 17.5s
#130 MiniMax M2.7 medium Minimax 2 3.0 0/3 19.0s
#37 Gemma 4 26B A4B medium Google 1 2.9 0/3 23.6s
#72 DeepSeek V3.2 medium DeepSeek 1 2.9 0/3 24.3s
#55 GLM 5.1 medium Z.ai 1 5.3 1/3 29.8s
#54 GPT-5 Mini medium OpenAI 1 3.6 0/3 44.6s
#23 GLM 5 Turbo medium Z.ai 1 2.9 0/3 71.1s
#42 GPT-5.2 medium OpenAI 1 5.9 1/3 77.8s

Mejores modelos por Cantidad de Tiempo agotado

Cantidad de Tiempo agotado vs Puntuación

Mejores modelos por Tiempo de respuesta (promedio)

Mejores modelos por Costo desperdiciado estimado