AI BENCHY
Advertise here

Fallos por categoría de AI BENCHY

Específico del dominio: Tiempo agotado

Específico del dominio
Tiempo agotado

Mira qué modelos de IA tienen más probabilidades de caer en Tiempo agotado dentro de Específico del dominio, para detectar puntos débiles más rápido. Ordenar por: Tiempo de respuesta (promedio) ↓.

Modelos mostrados

15

Fallos totales

34

Modelo más afectado

MiniMax M2.5 1
Rango Modelo Empresa Cantidad de Tiempo agotado Puntuación de categoría Pruebas correctas Tiempo de respuesta (promedio)
#129 MiniMax M2.5 medium Minimax 1 2.9 0/3 237.3s
#67 MiniMax M3 medium Minimax 2 5.5 1/3 233.1s
#103 DeepSeek V4 Pro high DeepSeek 1 2.9 0/3 205.7s
#94 GPT-5 Nano medium OpenAI 1 5.2 1/3 204.0s
#60 Kimi K2.6 medium Moonshot AI 2 5.3 1/3 202.4s
#49 Qwen3.5-Flash medium Qwen 1 5.3 1/3 146.5s
#161 Qwen3.5-9B medium Qwen 3 3.6 0/3 137.7s
#76 Kimi K2.5 medium Moonshot AI 1 3.5 0/3 137.3s
#86 Grok 4.1 Fast medium X AI 1 5.8 1/3 121.8s
#66 Qwen3.5-35B-A3B medium Qwen 2 4.1 0/3 88.3s
#30 Qwen3.5-27B medium Qwen 1 5.3 1/3 79.5s
#42 GPT-5.2 medium OpenAI 1 5.9 1/3 77.8s
#23 GLM 5 Turbo medium Z.ai 1 2.9 0/3 71.1s
#54 GPT-5 Mini medium OpenAI 1 3.6 0/3 44.6s
#55 GLM 5.1 medium Z.ai 1 5.3 1/3 29.8s

Mejores modelos por Cantidad de Tiempo agotado

Cantidad de Tiempo agotado vs Puntuación

Mejores modelos por Tiempo de respuesta (promedio)

Mejores modelos por Costo desperdiciado estimado