Ranking de fallos por Error de API

Mira qué modelos de IA se encuentran con Error de API con más frecuencia para detectar riesgos de fiabilidad antes de elegir. Ordenar por: Cantidad de fallos ↑.

Modelos mostrados

Fallos totales

161

Modelo más afectado

Muse Spark 1.1 1

Categorías

En la categoría Programación45 En la categoría Combinado26 En la categoría Llamada de herramientas17 En la categoría Análisis y extracción de datos14 En la categoría Trucos anti-IA14 En la categoría Cultura general13 En la categoría Inteligencia general12 En la categoría Resolución de acertijos12 En la categoría Específico del dominio7 En la categoría Seguimiento de instrucciones1

68/68

Rango	Modelo	Empresa	Cantidad de Error de API	Puntuación	Costo total	Pruebas correctas	Tiempo de respuesta (promedio)
#200	MiMo-V2-Flash none	Xiaomi	1	4.0	$0.025	4/21	2.76s
Pruebas totales 21 Pruebas incorrectas 17 Costo total $0.025 Tiempo de respuesta (promedio) 2.76s
#204	Qwen3.5-9B medium	Qwen	1	3.8	$0.036	3/22	82.2s
Pruebas totales 22 Pruebas incorrectas 19 Costo total $0.036 Tiempo de respuesta (promedio) 82.2s
#33	Kimi K3 max	Moonshot AI	2	8.0	$3.112	16/22	122.5s
Pruebas totales 22 Pruebas incorrectas 6 Costo total $3.112 Tiempo de respuesta (promedio) 122.5s
#76	DeepSeek V3.2 medium	DeepSeek	2	7.0	$0.078	11/22	68.6s
Pruebas totales 22 Pruebas incorrectas 11 Costo total $0.078 Tiempo de respuesta (promedio) 68.6s
#90	Qwen3.6 35B A3B medium	Qwen	2	6.7	$0.746	13/22	58.1s
Pruebas totales 22 Pruebas incorrectas 9 Costo total $0.746 Tiempo de respuesta (promedio) 58.1s
#108	Ring-2.6-1T medium	Inclusionai	2	6.3	$0.103	11/22	68.7s
Pruebas totales 22 Pruebas incorrectas 11 Costo total $0.103 Tiempo de respuesta (promedio) 68.7s
#110	Gemma 4 31B medium	Google	2	6.3	$0.163	14/22	75.4s
Pruebas totales 22 Pruebas incorrectas 8 Costo total $0.163 Tiempo de respuesta (promedio) 75.4s
#115	Gemma 4 31B none	Google	2	6.2	$0.035	10/22	5.34s
Pruebas totales 22 Pruebas incorrectas 12 Costo total $0.035 Tiempo de respuesta (promedio) 5.34s
#158	KAT-Coder-Air V2.5 low	Kwaipilot	2	5.4	$0.041	7/22	10.1s
Pruebas totales 22 Pruebas incorrectas 15 Costo total $0.041 Tiempo de respuesta (promedio) 10.1s
#161	Qwen3.6 35B A3B none	Qwen	2	5.3	$0.061	4/22	5.52s
Pruebas totales 22 Pruebas incorrectas 18 Costo total $0.061 Tiempo de respuesta (promedio) 5.52s
#167	Mistral Small 4 medium	Mistral	2	5.1	$0.096	5/22	10.8s
Pruebas totales 22 Pruebas incorrectas 17 Costo total $0.096 Tiempo de respuesta (promedio) 10.8s
#178	Ling-2.6-flash none	Inclusionai	2	4.9	$0.002	6/22	10.7s
Pruebas totales 22 Pruebas incorrectas 16 Costo total $0.002 Tiempo de respuesta (promedio) 10.7s
#181	Grok 4.20 Multi Agent Beta medium	X AI	2	4.8	$5.599	8/18	9.69s
Pruebas totales 18 Pruebas incorrectas 10 Costo total $5.599 Tiempo de respuesta (promedio) 9.69s
#183	Trinity Large Preview none	Arcee AI	2	4.8	$0.008	4/21	2.98s
Pruebas totales 21 Pruebas incorrectas 17 Costo total $0.008 Tiempo de respuesta (promedio) 2.98s
#100	Hy3 preview medium	Tencent	3	6.5	$0.018	14/21	16.3s
Pruebas totales 21 Pruebas incorrectas 7 Costo total $0.018 Tiempo de respuesta (promedio) 16.3s

←

1 2 3 4 5

→

Fallos por Error de API

Filtrar modelos

Mejores modelos por Cantidad de Error de API

Cantidad de Error de API vs Puntuación

Mejores modelos por Tiempo de respuesta (promedio)