Ranking de Específico del dominio x Tiempo agotado

Mira qué modelos de IA tienen más probabilidades de caer en Tiempo agotado dentro de Específico del dominio, para detectar puntos débiles más rápido. Ordenar por: Tiempo de respuesta (promedio) ↑.

Modelos mostrados

Fallos totales

Modelo más afectado

Claude Sonnet 4.6 1

Motivos de fallo

Respuesta incorrecta412 Tiempo agotado43 Formato extra17 Sin respuesta8 Error de API7 No siguió las instrucciones1

Categorías

Específico del dominio43 Programación26 Combinado5 Resolución de acertijos5 Inteligencia general4 Trucos anti-IA4 Análisis y extracción de datos1 Seguimiento de instrucciones1

32/32

Rango	Modelo	Empresa	Cantidad de Tiempo agotado	Puntuación de categoría	Costo total	Pruebas correctas	Tiempo de respuesta (promedio)
#40	Claude Sonnet 4.6 medium	Anthropic	1	2.9	$2.057	0/3	0ms
Pruebas totales 3 Pruebas incorrectas 3 Costo total $2.057 Tiempo de respuesta (promedio) 0ms
#42	GLM 5 medium	Z.ai	1	3.5	$0.307	0/3	0ms
Pruebas totales 3 Pruebas incorrectas 3 Costo total $0.307 Tiempo de respuesta (promedio) 0ms
#80	Seed-2.0-Mini medium	Bytedance Seed	3	3.0	$0.101	0/3	0ms
Pruebas totales 3 Pruebas incorrectas 3 Costo total $0.101 Tiempo de respuesta (promedio) 0ms
#15	Claude Opus 4.7 medium	Anthropic	1	7.7	$1.477	2/3	1.17s
Pruebas totales 3 Pruebas incorrectas 1 Costo total $1.477 Tiempo de respuesta (promedio) 1.17s
#109	Mimo V2 PRO medium	Xiaomi	1	5.3	$0.333	1/3	8.82s
Pruebas totales 3 Pruebas incorrectas 2 Costo total $0.333 Tiempo de respuesta (promedio) 8.82s
#184	Hunter Alpha medium	OpenRouter	1	3.0	$0.000	0/3	10.5s
Pruebas totales 3 Pruebas incorrectas 3 Costo total $0.000 Tiempo de respuesta (promedio) 10.5s
#140	Nemotron 3 Super medium	NVIDIA	1	2.9	$0.050	0/3	16.2s
Pruebas totales 3 Pruebas incorrectas 3 Costo total $0.050 Tiempo de respuesta (promedio) 16.2s
#57	Qwen3.5 Plus 2026-02-15 medium	Qwen	1	5.3	$0.437	1/3	17.5s
Pruebas totales 3 Pruebas incorrectas 2 Costo total $0.437 Tiempo de respuesta (promedio) 17.5s
#172	MiniMax M2.7 medium	Minimax	2	3.0	$0.163	0/3	19.0s
Pruebas totales 3 Pruebas incorrectas 3 Costo total $0.163 Tiempo de respuesta (promedio) 19.0s
#95	Gemma 4 26B A4B medium	Google	1	2.9	$0.089	0/3	23.6s
Pruebas totales 3 Pruebas incorrectas 3 Costo total $0.089 Tiempo de respuesta (promedio) 23.6s
#76	DeepSeek V3.2 medium	DeepSeek	1	2.9	$0.078	0/3	24.3s
Pruebas totales 3 Pruebas incorrectas 3 Costo total $0.078 Tiempo de respuesta (promedio) 24.3s
#74	GLM 5.1 medium	Z.ai	1	5.3	$0.535	1/3	29.8s
Pruebas totales 3 Pruebas incorrectas 2 Costo total $0.535 Tiempo de respuesta (promedio) 29.8s
#26	GPT-5 Mini medium	OpenAI	1	3.6	$0.237	0/3	44.6s
Pruebas totales 3 Pruebas incorrectas 3 Costo total $0.237 Tiempo de respuesta (promedio) 44.6s
#38	GLM 5.2 medium	Z.ai	1	4.1	$0.222	0/3	45.5s
Pruebas totales 3 Pruebas incorrectas 3 Costo total $0.222 Tiempo de respuesta (promedio) 45.5s
#49	GLM 5 Turbo medium	Z.ai	1	2.9	$0.323	0/3	71.1s
Pruebas totales 3 Pruebas incorrectas 3 Costo total $0.323 Tiempo de respuesta (promedio) 71.1s

Filtrar modelos

Mejores modelos por Cantidad de Tiempo agotado

Cantidad de Tiempo agotado vs Puntuación

Mejores modelos por Tiempo de respuesta (promedio)

Mejores modelos por Costo desperdiciado estimado

Específico del dominio: Tiempo agotado

Filtrar modelos

Mejores modelos por Cantidad de Tiempo agotado

Cantidad de Tiempo agotado vs Puntuación

Mejores modelos por Tiempo de respuesta (promedio)

Mejores modelos por Costo desperdiciado estimado