Ranking de fallos por Error de API

Mira qué modelos de IA se encuentran con Error de API con más frecuencia para detectar riesgos de fiabilidad antes de elegir. Ordenar por: Pruebas correctas ↑.

Modelos mostrados

Fallos totales

161

Modelo más afectado

Nemotron 3 Nano Omni 30b A3b Reasoning 6

Categorías

En la categoría Programación45 En la categoría Combinado26 En la categoría Llamada de herramientas17 En la categoría Análisis y extracción de datos14 En la categoría Trucos anti-IA14 En la categoría Cultura general13 En la categoría Inteligencia general12 En la categoría Resolución de acertijos12 En la categoría Específico del dominio7 En la categoría Seguimiento de instrucciones1

68/68

Rango	Modelo	Empresa	Cantidad de Error de API	Puntuación	Costo total	Pruebas correctas	Tiempo de respuesta (promedio)
#163	Mimo V2 Omni none	Xiaomi	1	5.5	$0.021	8/21	2.44s
Pruebas totales 21 Pruebas incorrectas 13 Costo total $0.021 Tiempo de respuesta (promedio) 2.44s
#143	North Mini Code medium	Cohere	1	5.9	$0.000	9/22	137.1s
Pruebas totales 22 Pruebas incorrectas 13 Costo total $0.000 Tiempo de respuesta (promedio) 137.1s
#185	Ring-2.6-1T none	Inclusionai	6	4.8	$0.026	9/22	55.1s
Pruebas totales 22 Pruebas incorrectas 13 Costo total $0.026 Tiempo de respuesta (promedio) 55.1s
#187	Grok 4.20 Multi Agent Beta medium	X AI	2	4.8	$5.599	8/18	9.69s
Pruebas totales 18 Pruebas incorrectas 10 Costo total $5.599 Tiempo de respuesta (promedio) 9.69s
#190	Hunter Alpha medium	OpenRouter	1	4.7	$0.000	8/18	10.3s
Pruebas totales 18 Pruebas incorrectas 10 Costo total $0.000 Tiempo de respuesta (promedio) 10.3s
#50	DeepSeek V4 Pro high	DeepSeek	1	7.7	$0.200	10/22	79.1s
Pruebas totales 22 Pruebas incorrectas 12 Costo total $0.200 Tiempo de respuesta (promedio) 79.1s
#96	LongCat 2.0 low	Meituan	1	6.7	$0.391	10/22	100.3s
Pruebas totales 22 Pruebas incorrectas 12 Costo total $0.391 Tiempo de respuesta (promedio) 100.3s
#121	Gemma 4 31B none	Google	2	6.2	$0.021	10/22	5.34s
Pruebas totales 22 Pruebas incorrectas 12 Costo total $0.021 Tiempo de respuesta (promedio) 5.34s
#181	Qwen3.6 Plus Preview medium	Qwen	8	4.9	$0.000	9/19	15.2s
Pruebas totales 19 Pruebas incorrectas 10 Costo total $0.000 Tiempo de respuesta (promedio) 15.2s
#192	Laguna M.1 medium	Poolside	4	4.7	$0.033	9/19	14.7s
Pruebas totales 19 Pruebas incorrectas 10 Costo total $0.033 Tiempo de respuesta (promedio) 14.7s
#140	Mimo V2 Omni medium	Xiaomi	1	5.9	$0.683	10/21	41.2s
Pruebas totales 21 Pruebas incorrectas 11 Costo total $0.683 Tiempo de respuesta (promedio) 41.2s
#159	Hy3 preview low	Tencent	7	5.5	$0.015	10/21	24.6s
Pruebas totales 21 Pruebas incorrectas 11 Costo total $0.015 Tiempo de respuesta (promedio) 24.6s
#66	KAT-Coder-Pro V2.5 low	Kwaipilot	1	7.4	$0.387	11/22	19.5s
Pruebas totales 22 Pruebas incorrectas 11 Costo total $0.387 Tiempo de respuesta (promedio) 19.5s
#80	DeepSeek V3.2 medium	DeepSeek	2	7.0	$0.078	11/22	68.6s
Pruebas totales 22 Pruebas incorrectas 11 Costo total $0.078 Tiempo de respuesta (promedio) 68.6s
#85	KAT-Coder-Pro V2.5 medium	Kwaipilot	1	6.9	$0.467	11/22	24.0s
Pruebas totales 22 Pruebas incorrectas 11 Costo total $0.467 Tiempo de respuesta (promedio) 24.0s

←

1 2 3 4 5

→

Fallos por Error de API

Filtrar modelos

Mejores modelos por Cantidad de Error de API

Cantidad de Error de API vs Puntuación

Mejores modelos por Tiempo de respuesta (promedio)