Ranking de fallos por Sin respuesta

Mira qué modelos de IA se encuentran con Sin respuesta con más frecuencia para detectar riesgos de fiabilidad antes de elegir. Ordenar por: Puntuación ↓.

Modelos mostrados

Fallos totales

Modelo más afectado

Grok 4.5 2

Categorías

En la categoría Combinado29 En la categoría Programación18 En la categoría Cultura general13 En la categoría Análisis y extracción de datos8 En la categoría Específico del dominio8 En la categoría Trucos anti-IA4 En la categoría Resolución de acertijos3 En la categoría Llamada de herramientas2 En la categoría Seguimiento de instrucciones2

67/67

Rango	Modelo	Empresa	Cantidad de Sin respuesta	Puntuación	Costo total	Pruebas correctas	Tiempo de respuesta (promedio)
#46	DeepSeek V4 Pro high	DeepSeek	1	7.7	$0.200	10/22	79.1s
Pruebas totales 22 Pruebas incorrectas 12 Costo total $0.200 Tiempo de respuesta (promedio) 79.1s
#47	MiniMax M3 medium	Minimax	1	7.6	$0.286	12/22	75.0s
Pruebas totales 22 Pruebas incorrectas 10 Costo total $0.286 Tiempo de respuesta (promedio) 75.0s
#49	GLM 5 Turbo medium	Z.ai	1	7.6	$0.323	14/21	23.0s
Pruebas totales 21 Pruebas incorrectas 7 Costo total $0.323 Tiempo de respuesta (promedio) 23.0s
#60	LongCat 2.0 medium	Meituan	1	7.4	$0.478	12/22	136.6s
Pruebas totales 22 Pruebas incorrectas 10 Costo total $0.478 Tiempo de respuesta (promedio) 136.6s
#66	Claude Opus 4.8 none	Anthropic	1	7.3	$1.166	13/22	4.91s
Pruebas totales 22 Pruebas incorrectas 9 Costo total $1.166 Tiempo de respuesta (promedio) 4.91s
#67	Step 3.7 Flash low	Stepfun	1	7.3	$0.454	12/22	20.7s
Pruebas totales 22 Pruebas incorrectas 10 Costo total $0.454 Tiempo de respuesta (promedio) 20.7s
#68	Kimi K2.6 medium	Moonshot AI	1	7.2	$1.036	12/22	110.0s
Pruebas totales 22 Pruebas incorrectas 10 Costo total $1.036 Tiempo de respuesta (promedio) 110.0s
#73	Grok 4.3 medium	X AI	1	7.1	$0.779	13/22	47.4s
Pruebas totales 22 Pruebas incorrectas 9 Costo total $0.779 Tiempo de respuesta (promedio) 47.4s
#74	GLM 5.1 medium	Z.ai	1	7.1	$0.535	13/22	46.8s
Pruebas totales 22 Pruebas incorrectas 9 Costo total $0.535 Tiempo de respuesta (promedio) 46.8s
#77	Kimi K2.5 medium	Moonshot AI	2	7.0	$0.600	10/22	99.0s
Pruebas totales 22 Pruebas incorrectas 12 Costo total $0.600 Tiempo de respuesta (promedio) 99.0s
#80	Seed-2.0-Mini medium	Bytedance Seed	1	7.0	$0.101	11/22	92.5s
Pruebas totales 22 Pruebas incorrectas 11 Costo total $0.101 Tiempo de respuesta (promedio) 92.5s
#86	Step 3.7 Flash high	Stepfun	4	6.9	$1.207	11/22	64.7s
Pruebas totales 22 Pruebas incorrectas 11 Costo total $1.207 Tiempo de respuesta (promedio) 64.7s
#89	Gemini 3 Flash Preview none	Google	1	6.8	$0.085	13/22	2.95s
Pruebas totales 22 Pruebas incorrectas 9 Costo total $0.085 Tiempo de respuesta (promedio) 2.95s
#90	Qwen3.6 35B A3B medium	Qwen	1	6.7	$0.746	13/22	58.1s
Pruebas totales 22 Pruebas incorrectas 9 Costo total $0.746 Tiempo de respuesta (promedio) 58.1s
#91	LongCat 2.0 low	Meituan	1	6.7	$0.391	10/22	100.3s
Pruebas totales 22 Pruebas incorrectas 12 Costo total $0.391 Tiempo de respuesta (promedio) 100.3s

←

1 2 3 4 5

→

Fallos por Sin respuesta

Filtrar modelos

Mejores modelos por Cantidad de Sin respuesta

Cantidad de Sin respuesta vs Puntuación

Mejores modelos por Tiempo de respuesta (promedio)