Ranking de Análisis y extracción de datos x Error de API

Mira qué modelos de IA tienen más probabilidades de caer en Error de API dentro de Análisis y extracción de datos, para detectar puntos débiles más rápido. Ordenar por: Tiempo de respuesta (promedio) ↓.

Modelos mostrados

Fallos totales

Modelo más afectado

Qwen3.5-35B-A3B 1

Motivos de fallo

Respuesta incorrecta41 Error de API14 Sin respuesta8 Formato extra6 Tiempo agotado1

Categorías

Programación45 Combinado26 Llamada de herramientas17 Análisis y extracción de datos14 Trucos anti-IA14 Cultura general13 Inteligencia general12 Resolución de acertijos12 Específico del dominio7 Seguimiento de instrucciones1

14/14

Rango	Modelo	Empresa	Cantidad de Error de API	Puntuación de categoría	Costo total	Pruebas correctas	Tiempo de respuesta (promedio)
#119	Qwen3.5-35B-A3B medium	Qwen	1	7.3	$0.837	1/2	59.3s
Pruebas totales 2 Pruebas incorrectas 1 Costo total $0.837 Tiempo de respuesta (promedio) 59.3s
#114	Qwen3.5-Flash medium	Qwen	1	7.3	$0.139	1/2	57.0s
Pruebas totales 2 Pruebas incorrectas 1 Costo total $0.139 Tiempo de respuesta (promedio) 57.0s
#179	Ring-2.6-1T none	Inclusionai	1	3.0	$0.026	0/2	45.9s
Pruebas totales 2 Pruebas incorrectas 2 Costo total $0.026 Tiempo de respuesta (promedio) 45.9s
#200	MiMo-V2-Flash none	Xiaomi	1	2.9	$0.025	0/2	19.7s
Pruebas totales 2 Pruebas incorrectas 2 Costo total $0.025 Tiempo de respuesta (promedio) 19.7s
#135	Hy3 preview high	Tencent	1	6.5	$0.048	1/2	12.1s
Pruebas totales 2 Pruebas incorrectas 1 Costo total $0.048 Tiempo de respuesta (promedio) 12.1s
#202	Grok Build 0.1 none	X AI	1	3.8	$0.547	0/2	9.33s
Pruebas totales 2 Pruebas incorrectas 2 Costo total $0.547 Tiempo de respuesta (promedio) 9.33s
#79	Gemini 3.5 Flash none	Google	1	6.5	$1.079	1/2	8.10s
Pruebas totales 2 Pruebas incorrectas 1 Costo total $1.079 Tiempo de respuesta (promedio) 8.10s
#206	gpt-oss-120b none	OpenAI	1	6.5	$0.010	1/2	7.12s
Pruebas totales 2 Pruebas incorrectas 1 Costo total $0.010 Tiempo de respuesta (promedio) 7.12s
#153	Hy3 preview low	Tencent	1	6.5	$0.015	1/2	5.85s
Pruebas totales 2 Pruebas incorrectas 1 Costo total $0.015 Tiempo de respuesta (promedio) 5.85s
#100	Hy3 preview medium	Tencent	1	6.5	$0.018	1/2	5.25s
Pruebas totales 2 Pruebas incorrectas 1 Costo total $0.018 Tiempo de respuesta (promedio) 5.25s
#199	Hy3 preview none	Tencent	1	6.5	$0.003	1/2	2.85s
Pruebas totales 2 Pruebas incorrectas 1 Costo total $0.003 Tiempo de respuesta (promedio) 2.85s
#167	Mistral Small 4 medium	Mistral	1	7.3	$0.096	1/2	1.23s
Pruebas totales 2 Pruebas incorrectas 1 Costo total $0.096 Tiempo de respuesta (promedio) 1.23s
#113	MiMo-V2-Flash medium	Xiaomi	1	6.5	$0.043	1/2	0ms
Pruebas totales 2 Pruebas incorrectas 1 Costo total $0.043 Tiempo de respuesta (promedio) 0ms
#209	Step 3.5 Flash none	Stepfun	1	1.5	$0.020	0/1	0ms
Pruebas totales 1 Pruebas incorrectas 1 Costo total $0.020 Tiempo de respuesta (promedio) 0ms

Filtrar modelos

Mejores modelos por Cantidad de Error de API

Cantidad de Error de API vs Puntuación

Mejores modelos por Tiempo de respuesta (promedio)

Mejores modelos por Costo desperdiciado estimado

Análisis y extracción de datos: Error de API

Filtrar modelos

Mejores modelos por Cantidad de Error de API

Cantidad de Error de API vs Puntuación

Mejores modelos por Tiempo de respuesta (promedio)

Mejores modelos por Costo desperdiciado estimado