Ranking de fallos por Error de API

Mira qué modelos de IA se encuentran con Error de API con más frecuencia para detectar riesgos de fiabilidad antes de elegir. Ordenar por: Puntuación ↑.

Modelos mostrados

Fallos totales

161

Modelo más afectado

LFM2-24B-A2B 4

Categorías

En la categoría Programación45 En la categoría Combinado26 En la categoría Llamada de herramientas17 En la categoría Análisis y extracción de datos14 En la categoría Trucos anti-IA14 En la categoría Cultura general13 En la categoría Inteligencia general12 En la categoría Resolución de acertijos12 En la categoría Específico del dominio7 En la categoría Seguimiento de instrucciones1

68/68

Rango	Modelo	Empresa	Cantidad de Error de API	Puntuación	Costo total	Pruebas correctas	Tiempo de respuesta (promedio)
#210	LFM2-24B-A2B none	Liquid	4	2.2	$0.001	2/16	782ms
Pruebas totales 16 Pruebas incorrectas 14 Costo total $0.001 Tiempo de respuesta (promedio) 782ms
#209	Step 3.5 Flash none	Stepfun	4	2.3	$0.020	6/12	39.0s
Pruebas totales 12 Pruebas incorrectas 6 Costo total $0.020 Tiempo de respuesta (promedio) 39.0s
#208	Nemotron 3 Nano Omni 30b A3b Reasoning none	NVIDIA	6	3.2	$0.000	2/19	728ms
Pruebas totales 19 Pruebas incorrectas 17 Costo total $0.000 Tiempo de respuesta (promedio) 728ms
#207	Nemotron 3 Nano Omni 30b A3b Reasoning medium	NVIDIA	6	3.4	$0.000	4/19	17.1s
Pruebas totales 19 Pruebas incorrectas 15 Costo total $0.000 Tiempo de respuesta (promedio) 17.1s
#206	gpt-oss-120b none	OpenAI	3	3.7	$0.010	6/19	21.6s
Pruebas totales 19 Pruebas incorrectas 13 Costo total $0.010 Tiempo de respuesta (promedio) 21.6s
#205	Laguna Xs.2 none	Poolside	4	3.8	$0.004	5/19	806ms
Pruebas totales 19 Pruebas incorrectas 14 Costo total $0.004 Tiempo de respuesta (promedio) 806ms
#204	Qwen3.5-9B medium	Qwen	1	3.8	$0.036	3/22	82.2s
Pruebas totales 22 Pruebas incorrectas 19 Costo total $0.036 Tiempo de respuesta (promedio) 82.2s
#202	Grok Build 0.1 none	X AI	3	4.0	$0.547	7/19	28.7s
Pruebas totales 19 Pruebas incorrectas 12 Costo total $0.547 Tiempo de respuesta (promedio) 28.7s
#200	MiMo-V2-Flash none	Xiaomi	1	4.0	$0.025	4/21	2.76s
Pruebas totales 21 Pruebas incorrectas 17 Costo total $0.025 Tiempo de respuesta (promedio) 2.76s
#199	Hy3 preview none	Tencent	4	4.0	$0.003	4/21	12.9s
Pruebas totales 21 Pruebas incorrectas 17 Costo total $0.003 Tiempo de respuesta (promedio) 12.9s
#198	Laguna Xs.2 medium	Poolside	4	4.1	$0.015	6/19	6.73s
Pruebas totales 19 Pruebas incorrectas 13 Costo total $0.015 Tiempo de respuesta (promedio) 6.73s
#196	Hunter Alpha none	OpenRouter	1	4.2	$0.000	6/18	4.70s
Pruebas totales 18 Pruebas incorrectas 12 Costo total $0.000 Tiempo de respuesta (promedio) 4.70s
#195	Elephant Alpha medium	Openrouter	3	4.3	$0.000	6/21	1.27s
Pruebas totales 21 Pruebas incorrectas 15 Costo total $0.000 Tiempo de respuesta (promedio) 1.27s
#193	Elephant Alpha none	Openrouter	3	4.3	$0.000	5/21	1.22s
Pruebas totales 21 Pruebas incorrectas 16 Costo total $0.000 Tiempo de respuesta (promedio) 1.22s
#192	Laguna M.1 none	Poolside	4	4.4	$0.009	4/19	2.89s
Pruebas totales 19 Pruebas incorrectas 15 Costo total $0.009 Tiempo de respuesta (promedio) 2.89s

1 2 3 4 5

→

Fallos por Error de API

Filtrar modelos

Mejores modelos por Cantidad de Error de API

Cantidad de Error de API vs Puntuación

Mejores modelos por Tiempo de respuesta (promedio)