Ranking de fallos por Sin respuesta

Mira qué modelos de IA se encuentran con Sin respuesta con más frecuencia para detectar riesgos de fiabilidad antes de elegir. Ordenar por: Tiempo de respuesta (promedio) ↓.

Modelos mostrados

Fallos totales

Modelo más afectado

Step 3.5 Flash 1

Categorías

En la categoría Combinado29 En la categoría Programación18 En la categoría Cultura general13 En la categoría Análisis y extracción de datos8 En la categoría Específico del dominio8 En la categoría Trucos anti-IA4 En la categoría Resolución de acertijos3 En la categoría Llamada de herramientas2 En la categoría Seguimiento de instrucciones2

67/67

Rango	Modelo	Empresa	Cantidad de Sin respuesta	Puntuación	Costo total	Pruebas correctas	Tiempo de respuesta (promedio)
#130	Step 3.5 Flash medium	Stepfun	1	6.0	$0.108	11/21	174.2s
Pruebas totales 21 Pruebas incorrectas 10 Costo total $0.108 Tiempo de respuesta (promedio) 174.2s
#97	LongCat 2.0 high	Meituan	2	6.6	$0.469	9/22	148.7s
Pruebas totales 22 Pruebas incorrectas 13 Costo total $0.469 Tiempo de respuesta (promedio) 148.7s
#194	GLM 4.7 Flash medium	Z.ai	3	4.3	$0.166	4/22	142.6s
Pruebas totales 22 Pruebas incorrectas 18 Costo total $0.166 Tiempo de respuesta (promedio) 142.6s
#60	LongCat 2.0 medium	Meituan	1	7.4	$0.478	12/22	136.6s
Pruebas totales 22 Pruebas incorrectas 10 Costo total $0.478 Tiempo de respuesta (promedio) 136.6s
#33	Kimi K3 max	Moonshot AI	1	8.0	$3.112	16/22	122.5s
Pruebas totales 22 Pruebas incorrectas 6 Costo total $3.112 Tiempo de respuesta (promedio) 122.5s
#119	Qwen3.5-35B-A3B medium	Qwen	2	6.2	$0.837	11/22	112.5s
Pruebas totales 22 Pruebas incorrectas 11 Costo total $0.837 Tiempo de respuesta (promedio) 112.5s
#68	Kimi K2.6 medium	Moonshot AI	1	7.2	$1.036	12/22	110.0s
Pruebas totales 22 Pruebas incorrectas 10 Costo total $1.036 Tiempo de respuesta (promedio) 110.0s
#99	Qwen3.6 27B medium	Qwen	3	6.5	$0.779	10/22	106.3s
Pruebas totales 22 Pruebas incorrectas 12 Costo total $0.779 Tiempo de respuesta (promedio) 106.3s
#95	Gemma 4 26B A4B medium	Google	2	6.6	$0.089	14/22	103.8s
Pruebas totales 22 Pruebas incorrectas 8 Costo total $0.089 Tiempo de respuesta (promedio) 103.8s
#91	LongCat 2.0 low	Meituan	1	6.7	$0.391	10/22	100.3s
Pruebas totales 22 Pruebas incorrectas 12 Costo total $0.391 Tiempo de respuesta (promedio) 100.3s
#77	Kimi K2.5 medium	Moonshot AI	2	7.0	$0.600	10/22	99.0s
Pruebas totales 22 Pruebas incorrectas 12 Costo total $0.600 Tiempo de respuesta (promedio) 99.0s
#80	Seed-2.0-Mini medium	Bytedance Seed	1	7.0	$0.101	11/22	92.5s
Pruebas totales 22 Pruebas incorrectas 11 Costo total $0.101 Tiempo de respuesta (promedio) 92.5s
#204	Qwen3.5-9B medium	Qwen	2	3.8	$0.036	3/22	82.2s
Pruebas totales 22 Pruebas incorrectas 19 Costo total $0.036 Tiempo de respuesta (promedio) 82.2s
#46	DeepSeek V4 Pro high	DeepSeek	1	7.7	$0.200	10/22	79.1s
Pruebas totales 22 Pruebas incorrectas 12 Costo total $0.200 Tiempo de respuesta (promedio) 79.1s
#12	Grok 4.5 high	X AI	2	8.9	$1.707	17/22	76.5s
Pruebas totales 22 Pruebas incorrectas 5 Costo total $1.707 Tiempo de respuesta (promedio) 76.5s

1 2 3 4 5

→

Fallos por Sin respuesta

Filtrar modelos

Mejores modelos por Cantidad de Sin respuesta

Cantidad de Sin respuesta vs Puntuación

Mejores modelos por Tiempo de respuesta (promedio)