AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

Fallos por categoría de AI BENCHY

Específico del dominio: Tiempo agotado

Específico del dominio
Tiempo agotado

Mira qué modelos de IA tienen más probabilidades de caer en Tiempo agotado dentro de Específico del dominio, para detectar puntos débiles más rápido. Ordenar por: Cantidad de fallos ↑.

Modelos mostrados

15

Fallos totales

34

Modelo más afectado

Claude Opus 4.7 1
Rango Modelo Empresa Cantidad de Tiempo agotado Puntuación de categoría Pruebas correctas Tiempo de respuesta (promedio)
#11 Claude Opus 4.7 medium Anthropic 1 7.7 2/3 1.17s
#17 GLM 5 medium Z.ai 1 3.5 0/3 0ms
#23 GLM 5 Turbo medium Z.ai 1 2.9 0/3 71.1s
#25 Qwen3.5 Plus 2026-02-15 medium Qwen 1 5.3 1/3 17.5s
#30 Qwen3.5-27B medium Qwen 1 5.3 1/3 79.5s
#37 Gemma 4 26B A4B medium Google 1 2.9 0/3 23.6s
#42 GPT-5.2 medium OpenAI 1 5.9 1/3 77.8s
#49 Qwen3.5-Flash medium Qwen 1 5.3 1/3 146.5s
#51 Mimo V2 PRO medium Xiaomi 1 5.3 1/3 8.82s
#52 Claude Sonnet 4.6 medium Anthropic 1 2.9 0/3 0ms
#54 GPT-5 Mini medium OpenAI 1 3.6 0/3 44.6s
#55 GLM 5.1 medium Z.ai 1 5.3 1/3 29.8s
#72 DeepSeek V3.2 medium DeepSeek 1 2.9 0/3 24.3s
#76 Kimi K2.5 medium Moonshot AI 1 3.5 0/3 137.3s
#79 Hunter Alpha medium OpenRouter 1 3.0 0/3 10.5s

Mejores modelos por Cantidad de Tiempo agotado

Cantidad de Tiempo agotado vs Puntuación

Mejores modelos por Tiempo de respuesta (promedio)

Mejores modelos por Costo desperdiciado estimado