Ranking de fallos por Tiempo agotado

Mira qué modelos de IA se encuentran con Tiempo agotado con más frecuencia para detectar riesgos de fiabilidad antes de elegir. Ordenar por: Tiempo de respuesta (promedio) ↑.

Modelos mostrados

Fallos totales

Modelo más afectado

Laguna XS 2.1 1

Categorías

En la categoría Específico del dominio43 En la categoría Programación26 En la categoría Combinado5 En la categoría Resolución de acertijos5 En la categoría Inteligencia general4 En la categoría Trucos anti-IA4 En la categoría Análisis y extracción de datos1 En la categoría Seguimiento de instrucciones1

44/44

Rango	Modelo	Empresa	Cantidad de Tiempo agotado	Puntuación	Costo total	Pruebas correctas	Tiempo de respuesta (promedio)
#70	Qwen3.5 Plus 2026-04-20 medium	Qwen	1	7.2	$0.317	13/22	46.4s
Pruebas totales 22 Pruebas incorrectas 9 Costo total $0.317 Tiempo de respuesta (promedio) 46.4s
#74	GLM 5.1 medium	Z.ai	2	7.1	$0.535	13/22	46.8s
Pruebas totales 22 Pruebas incorrectas 9 Costo total $0.535 Tiempo de respuesta (promedio) 46.8s
#36	Qwen3.7 Plus medium	Qwen	1	7.9	$0.267	15/22	51.5s
Pruebas totales 22 Pruebas incorrectas 7 Costo total $0.267 Tiempo de respuesta (promedio) 51.5s
#140	Nemotron 3 Super medium	NVIDIA	1	5.7	$0.050	8/22	52.0s
Pruebas totales 22 Pruebas incorrectas 14 Costo total $0.050 Tiempo de respuesta (promedio) 52.0s
#128	GPT-5 Nano medium	OpenAI	1	6.1	$0.114	9/22	54.9s
Pruebas totales 22 Pruebas incorrectas 13 Costo total $0.114 Tiempo de respuesta (promedio) 54.9s
#31	GLM 5.2 high	Z.ai	3	8.0	$0.970	14/22	62.7s
Pruebas totales 22 Pruebas incorrectas 8 Costo total $0.970 Tiempo de respuesta (promedio) 62.7s
#72	Qwen3.5-122B-A10B medium	Qwen	2	7.1	$1.046	14/22	64.2s
Pruebas totales 22 Pruebas incorrectas 8 Costo total $1.046 Tiempo de respuesta (promedio) 64.2s
#19	Qwen3.6 Max Preview medium	Qwen	1	8.4	$1.143	16/22	67.5s
Pruebas totales 22 Pruebas incorrectas 6 Costo total $1.143 Tiempo de respuesta (promedio) 67.5s
#190	MiniMax M2.5 medium	Minimax	4	4.6	$0.340	5/22	68.3s
Pruebas totales 22 Pruebas incorrectas 17 Costo total $0.340 Tiempo de respuesta (promedio) 68.3s
#76	DeepSeek V3.2 medium	DeepSeek	2	7.0	$0.078	11/22	68.6s
Pruebas totales 22 Pruebas incorrectas 11 Costo total $0.078 Tiempo de respuesta (promedio) 68.6s
#47	MiniMax M3 medium	Minimax	3	7.6	$0.286	12/22	75.0s
Pruebas totales 22 Pruebas incorrectas 10 Costo total $0.286 Tiempo de respuesta (promedio) 75.0s
#110	Gemma 4 31B medium	Google	2	6.3	$0.163	14/22	75.4s
Pruebas totales 22 Pruebas incorrectas 8 Costo total $0.163 Tiempo de respuesta (promedio) 75.4s
#46	DeepSeek V4 Pro high	DeepSeek	1	7.7	$0.200	10/22	79.1s
Pruebas totales 22 Pruebas incorrectas 12 Costo total $0.200 Tiempo de respuesta (promedio) 79.1s
#204	Qwen3.5-9B medium	Qwen	12	3.8	$0.036	3/22	82.2s
Pruebas totales 22 Pruebas incorrectas 19 Costo total $0.036 Tiempo de respuesta (promedio) 82.2s
#52	Kimi K2.7 Code medium	Moonshot AI	3	7.5	$0.751	12/22	84.2s
Pruebas totales 22 Pruebas incorrectas 10 Costo total $0.751 Tiempo de respuesta (promedio) 84.2s

Fallos por Tiempo agotado

Filtrar modelos

Mejores modelos por Cantidad de Tiempo agotado

Cantidad de Tiempo agotado vs Puntuación

Mejores modelos por Tiempo de respuesta (promedio)