Ranking de fallos por Tiempo agotado

Mira qué modelos de IA se encuentran con Tiempo agotado con más frecuencia para detectar riesgos de fiabilidad antes de elegir. Ordenar por: Cantidad de fallos ↑.

Modelos mostrados

Fallos totales

Modelo más afectado

Claude Opus 4.7 1

Categorías

En la categoría Específico del dominio43 En la categoría Programación26 En la categoría Combinado5 En la categoría Resolución de acertijos5 En la categoría Inteligencia general4 En la categoría Trucos anti-IA4 En la categoría Análisis y extracción de datos1 En la categoría Seguimiento de instrucciones1

44/44

Rango	Modelo	Empresa	Cantidad de Tiempo agotado	Puntuación	Costo total	Pruebas correctas	Tiempo de respuesta (promedio)
#15	Claude Opus 4.7 medium	Anthropic	1	8.7	$1.477	18/22	7.61s
Pruebas totales 22 Pruebas incorrectas 4 Costo total $1.477 Tiempo de respuesta (promedio) 7.61s
#19	Qwen3.6 Max Preview medium	Qwen	1	8.4	$1.143	16/22	67.5s
Pruebas totales 22 Pruebas incorrectas 6 Costo total $1.143 Tiempo de respuesta (promedio) 67.5s
#21	GPT-5.2 medium	OpenAI	1	8.4	$0.951	14/22	22.6s
Pruebas totales 22 Pruebas incorrectas 8 Costo total $0.951 Tiempo de respuesta (promedio) 22.6s
#26	GPT-5 Mini medium	OpenAI	1	8.1	$0.237	12/22	27.6s
Pruebas totales 22 Pruebas incorrectas 10 Costo total $0.237 Tiempo de respuesta (promedio) 27.6s
#36	Qwen3.7 Plus medium	Qwen	1	7.9	$0.267	15/22	51.5s
Pruebas totales 22 Pruebas incorrectas 7 Costo total $0.267 Tiempo de respuesta (promedio) 51.5s
#38	GLM 5.2 medium	Z.ai	1	7.8	$0.222	15/21	23.3s
Pruebas totales 21 Pruebas incorrectas 6 Costo total $0.222 Tiempo de respuesta (promedio) 23.3s
#40	Claude Sonnet 4.6 medium	Anthropic	1	7.8	$2.057	14/22	25.9s
Pruebas totales 22 Pruebas incorrectas 8 Costo total $2.057 Tiempo de respuesta (promedio) 25.9s
#42	GLM 5 medium	Z.ai	1	7.7	$0.307	15/21	33.5s
Pruebas totales 21 Pruebas incorrectas 6 Costo total $0.307 Tiempo de respuesta (promedio) 33.5s
#46	DeepSeek V4 Pro high	DeepSeek	1	7.7	$0.200	10/22	79.1s
Pruebas totales 22 Pruebas incorrectas 12 Costo total $0.200 Tiempo de respuesta (promedio) 79.1s
#49	GLM 5 Turbo medium	Z.ai	1	7.6	$0.323	14/21	23.0s
Pruebas totales 21 Pruebas incorrectas 7 Costo total $0.323 Tiempo de respuesta (promedio) 23.0s
#58	Qwen3.5-27B medium	Qwen	1	7.4	$1.627	13/22	111.9s
Pruebas totales 22 Pruebas incorrectas 9 Costo total $1.627 Tiempo de respuesta (promedio) 111.9s
#60	LongCat 2.0 medium	Meituan	1	7.4	$0.478	12/22	136.6s
Pruebas totales 22 Pruebas incorrectas 10 Costo total $0.478 Tiempo de respuesta (promedio) 136.6s
#70	Qwen3.5 Plus 2026-04-20 medium	Qwen	1	7.2	$0.317	13/22	46.4s
Pruebas totales 22 Pruebas incorrectas 9 Costo total $0.317 Tiempo de respuesta (promedio) 46.4s
#91	LongCat 2.0 low	Meituan	1	6.7	$0.391	10/22	100.3s
Pruebas totales 22 Pruebas incorrectas 12 Costo total $0.391 Tiempo de respuesta (promedio) 100.3s
#109	Mimo V2 PRO medium	Xiaomi	1	6.3	$0.333	12/21	22.2s
Pruebas totales 21 Pruebas incorrectas 9 Costo total $0.333 Tiempo de respuesta (promedio) 22.2s

Fallos por Tiempo agotado

Filtrar modelos

Mejores modelos por Cantidad de Tiempo agotado

Cantidad de Tiempo agotado vs Puntuación

Mejores modelos por Tiempo de respuesta (promedio)