Ranking de fallos por Error de API

Mira qué modelos de IA se encuentran con Error de API con más frecuencia para detectar riesgos de fiabilidad antes de elegir. Ordenar por: Tiempo de respuesta (promedio) ↑.

Modelos mostrados

Fallos totales

161

Modelo más afectado

Nemotron 3 Nano Omni 30b A3b Reasoning 6

Categorías

En la categoría Programación45 En la categoría Combinado26 En la categoría Llamada de herramientas17 En la categoría Análisis y extracción de datos14 En la categoría Trucos anti-IA14 En la categoría Cultura general13 En la categoría Inteligencia general12 En la categoría Resolución de acertijos12 En la categoría Específico del dominio7 En la categoría Seguimiento de instrucciones1

68/68

Rango	Modelo	Empresa	Cantidad de Error de API	Puntuación	Costo total	Pruebas correctas	Tiempo de respuesta (promedio)
#149	KAT-Coder-Air V2.5 medium	Kwaipilot	1	5.6	$0.048	8/22	8.42s
Pruebas totales 22 Pruebas incorrectas 14 Costo total $0.048 Tiempo de respuesta (promedio) 8.42s
#162	Ling-2.6-1T none	Inclusionai	3	5.3	$0.016	4/22	8.58s
Pruebas totales 22 Pruebas incorrectas 18 Costo total $0.016 Tiempo de respuesta (promedio) 8.58s
#133	Gemini 3 PRO Preview medium	Google	4	6.0	$0.385	14/21	9.05s
Pruebas totales 21 Pruebas incorrectas 7 Costo total $0.385 Tiempo de respuesta (promedio) 9.05s
#181	Grok 4.20 Multi Agent Beta medium	X AI	2	4.8	$5.599	8/18	9.69s
Pruebas totales 18 Pruebas incorrectas 10 Costo total $5.599 Tiempo de respuesta (promedio) 9.69s
#79	Gemini 3.5 Flash none	Google	4	7.0	$1.079	15/22	9.93s
Pruebas totales 22 Pruebas incorrectas 7 Costo total $1.079 Tiempo de respuesta (promedio) 9.93s
#158	KAT-Coder-Air V2.5 low	Kwaipilot	2	5.4	$0.041	7/22	10.1s
Pruebas totales 22 Pruebas incorrectas 15 Costo total $0.041 Tiempo de respuesta (promedio) 10.1s
#184	Hunter Alpha medium	OpenRouter	1	4.7	$0.000	8/18	10.3s
Pruebas totales 18 Pruebas incorrectas 10 Costo total $0.000 Tiempo de respuesta (promedio) 10.3s
#178	Ling-2.6-flash none	Inclusionai	2	4.9	$0.002	6/22	10.7s
Pruebas totales 22 Pruebas incorrectas 16 Costo total $0.002 Tiempo de respuesta (promedio) 10.7s
#167	Mistral Small 4 medium	Mistral	2	5.1	$0.096	5/22	10.8s
Pruebas totales 22 Pruebas incorrectas 17 Costo total $0.096 Tiempo de respuesta (promedio) 10.8s
#146	Owl Alpha medium	Openrouter	1	5.6	$0.000	8/21	11.9s
Pruebas totales 21 Pruebas incorrectas 13 Costo total $0.000 Tiempo de respuesta (promedio) 11.9s
#182	KAT-Coder-Air V2.5 none	Kwaipilot	1	4.8	$0.067	5/22	12.2s
Pruebas totales 22 Pruebas incorrectas 17 Costo total $0.067 Tiempo de respuesta (promedio) 12.2s
#199	Hy3 preview none	Tencent	4	4.0	$0.003	4/21	12.9s
Pruebas totales 21 Pruebas incorrectas 17 Costo total $0.003 Tiempo de respuesta (promedio) 12.9s
#186	Laguna M.1 medium	Poolside	4	4.7	$0.033	9/19	14.7s
Pruebas totales 19 Pruebas incorrectas 10 Costo total $0.033 Tiempo de respuesta (promedio) 14.7s
#175	Qwen3.6 Plus Preview medium	Qwen	8	4.9	$0.000	9/19	15.2s
Pruebas totales 19 Pruebas incorrectas 10 Costo total $0.000 Tiempo de respuesta (promedio) 15.2s
#144	KAT-Coder-Air V2.5 high	Kwaipilot	3	5.6	$0.077	7/22	15.9s
Pruebas totales 22 Pruebas incorrectas 15 Costo total $0.077 Tiempo de respuesta (promedio) 15.9s

←

1 2 3 4 5

→

Fallos por Error de API

Filtrar modelos

Mejores modelos por Cantidad de Error de API

Cantidad de Error de API vs Puntuación

Mejores modelos por Tiempo de respuesta (promedio)