Ranking de Específico del dominio x Tiempo agotado

Mira qué modelos de IA tienen más probabilidades de caer en Tiempo agotado dentro de Específico del dominio, para detectar puntos débiles más rápido. Ordenar por: Pruebas correctas ↓.

Modelos mostrados

Fallos totales

Modelo más afectado

Claude Opus 4.7 1

Motivos de fallo

Respuesta incorrecta412 Tiempo agotado43 Formato extra17 Sin respuesta8 Error de API7 No siguió las instrucciones1

Categorías

Específico del dominio43 Programación26 Combinado5 Resolución de acertijos5 Inteligencia general4 Trucos anti-IA4 Análisis y extracción de datos1 Seguimiento de instrucciones1

32/32

Rango	Modelo	Empresa	Cantidad de Tiempo agotado	Puntuación de categoría	Costo total	Pruebas correctas	Tiempo de respuesta (promedio)
#15	Claude Opus 4.7 medium	Anthropic	1	7.7	$1.477	2/3	1.17s
Pruebas totales 3 Pruebas incorrectas 1 Costo total $1.477 Tiempo de respuesta (promedio) 1.17s
#21	GPT-5.2 medium	OpenAI	1	5.9	$0.951	1/3	77.8s
Pruebas totales 3 Pruebas incorrectas 2 Costo total $0.951 Tiempo de respuesta (promedio) 77.8s
#33	Kimi K3 max	Moonshot AI	2	5.9	$3.112	1/3	490.1s
Pruebas totales 3 Pruebas incorrectas 2 Costo total $3.112 Tiempo de respuesta (promedio) 490.1s
#47	MiniMax M3 medium	Minimax	2	5.5	$0.286	1/3	233.1s
Pruebas totales 3 Pruebas incorrectas 2 Costo total $0.286 Tiempo de respuesta (promedio) 233.1s
#52	Kimi K2.7 Code medium	Moonshot AI	2	5.5	$0.751	1/3	213.3s
Pruebas totales 3 Pruebas incorrectas 2 Costo total $0.751 Tiempo de respuesta (promedio) 213.3s
#57	Qwen3.5 Plus 2026-02-15 medium	Qwen	1	5.3	$0.437	1/3	17.5s
Pruebas totales 3 Pruebas incorrectas 2 Costo total $0.437 Tiempo de respuesta (promedio) 17.5s
#58	Qwen3.5-27B medium	Qwen	1	5.3	$1.627	1/3	79.5s
Pruebas totales 3 Pruebas incorrectas 2 Costo total $1.627 Tiempo de respuesta (promedio) 79.5s
#68	Kimi K2.6 medium	Moonshot AI	2	5.3	$1.036	1/3	202.4s
Pruebas totales 3 Pruebas incorrectas 2 Costo total $1.036 Tiempo de respuesta (promedio) 202.4s
#74	GLM 5.1 medium	Z.ai	1	5.3	$0.535	1/3	29.8s
Pruebas totales 3 Pruebas incorrectas 2 Costo total $0.535 Tiempo de respuesta (promedio) 29.8s
#109	Mimo V2 PRO medium	Xiaomi	1	5.3	$0.333	1/3	8.82s
Pruebas totales 3 Pruebas incorrectas 2 Costo total $0.333 Tiempo de respuesta (promedio) 8.82s
#114	Qwen3.5-Flash medium	Qwen	1	5.3	$0.139	1/3	146.5s
Pruebas totales 3 Pruebas incorrectas 2 Costo total $0.139 Tiempo de respuesta (promedio) 146.5s
#128	GPT-5 Nano medium	OpenAI	1	5.2	$0.114	1/3	204.0s
Pruebas totales 3 Pruebas incorrectas 2 Costo total $0.114 Tiempo de respuesta (promedio) 204.0s
#185	Grok 4.1 Fast medium	X AI	1	5.8	$0.069	1/3	121.8s
Pruebas totales 3 Pruebas incorrectas 2 Costo total $0.069 Tiempo de respuesta (promedio) 121.8s
#26	GPT-5 Mini medium	OpenAI	1	3.6	$0.237	0/3	44.6s
Pruebas totales 3 Pruebas incorrectas 3 Costo total $0.237 Tiempo de respuesta (promedio) 44.6s
#31	GLM 5.2 high	Z.ai	1	3.7	$0.970	0/3	74.0s
Pruebas totales 3 Pruebas incorrectas 3 Costo total $0.970 Tiempo de respuesta (promedio) 74.0s

Filtrar modelos

Mejores modelos por Cantidad de Tiempo agotado

Cantidad de Tiempo agotado vs Puntuación

Mejores modelos por Tiempo de respuesta (promedio)

Mejores modelos por Costo desperdiciado estimado

Específico del dominio: Tiempo agotado

Filtrar modelos

Mejores modelos por Cantidad de Tiempo agotado

Cantidad de Tiempo agotado vs Puntuación

Mejores modelos por Tiempo de respuesta (promedio)

Mejores modelos por Costo desperdiciado estimado