Ranking de Cultura general x Error de API

Mira qué modelos de IA tienen más probabilidades de caer en Error de API dentro de Cultura general, para detectar puntos débiles más rápido. Ordenar por: Tiempo de respuesta (promedio) ↓.

Modelos mostrados

Fallos totales

Modelo más afectado

North Mini Code 1

Motivos de fallo

Respuesta incorrecta172 Error de API13 Sin respuesta13

Categorías

Programación45 Combinado26 Llamada de herramientas17 Análisis y extracción de datos14 Trucos anti-IA14 Cultura general13 Inteligencia general12 Resolución de acertijos12 Específico del dominio7 Seguimiento de instrucciones1

13/13

Rango	Modelo	Empresa	Cantidad de Error de API	Puntuación de categoría	Costo total	Pruebas correctas	Tiempo de respuesta (promedio)
#143	North Mini Code medium	Cohere	1	3.0	$0.000	0/1	305.0s
Pruebas totales 1 Pruebas incorrectas 1 Costo total $0.000 Tiempo de respuesta (promedio) 305.0s
#210	Qwen3.5-9B medium	Qwen	1	3.0	$0.036	0/1	177.0s
Pruebas totales 1 Pruebas incorrectas 1 Costo total $0.036 Tiempo de respuesta (promedio) 177.0s
#139	Gemini 3 PRO Preview medium	Google	1	3.0	$0.385	0/1	0ms
Pruebas totales 1 Pruebas incorrectas 1 Costo total $0.385 Tiempo de respuesta (promedio) 0ms
#168	Ling-2.6-1T none	Inclusionai	1	3.0	$0.016	0/1	0ms
Pruebas totales 1 Pruebas incorrectas 1 Costo total $0.016 Tiempo de respuesta (promedio) 0ms
#181	Qwen3.6 Plus Preview medium	Qwen	1	3.0	$0.000	0/1	0ms
Pruebas totales 1 Pruebas incorrectas 1 Costo total $0.000 Tiempo de respuesta (promedio) 0ms
#192	Laguna M.1 medium	Poolside	1	3.0	$0.033	0/1	0ms
Pruebas totales 1 Pruebas incorrectas 1 Costo total $0.033 Tiempo de respuesta (promedio) 0ms
#198	Laguna M.1 none	Poolside	1	3.0	$0.009	0/1	0ms
Pruebas totales 1 Pruebas incorrectas 1 Costo total $0.009 Tiempo de respuesta (promedio) 0ms
#199	Elephant Alpha none	Openrouter	1	3.0	$0.000	0/1	0ms
Pruebas totales 1 Pruebas incorrectas 1 Costo total $0.000 Tiempo de respuesta (promedio) 0ms
#201	Elephant Alpha medium	Openrouter	1	3.0	$0.000	0/1	0ms
Pruebas totales 1 Pruebas incorrectas 1 Costo total $0.000 Tiempo de respuesta (promedio) 0ms
#204	Laguna Xs.2 medium	Poolside	1	3.0	$0.015	0/1	0ms
Pruebas totales 1 Pruebas incorrectas 1 Costo total $0.015 Tiempo de respuesta (promedio) 0ms
#211	Laguna Xs.2 none	Poolside	1	3.0	$0.004	0/1	0ms
Pruebas totales 1 Pruebas incorrectas 1 Costo total $0.004 Tiempo de respuesta (promedio) 0ms
#213	Nemotron 3 Nano Omni 30b A3b Reasoning medium	NVIDIA	1	3.0	$0.000	0/1	0ms
Pruebas totales 1 Pruebas incorrectas 1 Costo total $0.000 Tiempo de respuesta (promedio) 0ms
#214	Nemotron 3 Nano Omni 30b A3b Reasoning none	NVIDIA	1	3.0	$0.000	0/1	0ms
Pruebas totales 1 Pruebas incorrectas 1 Costo total $0.000 Tiempo de respuesta (promedio) 0ms

Filtrar modelos

Mejores modelos por Cantidad de Error de API

Cantidad de Error de API vs Puntuación

Mejores modelos por Tiempo de respuesta (promedio)

Mejores modelos por Costo desperdiciado estimado

Cultura general: Error de API

Filtrar modelos

Mejores modelos por Cantidad de Error de API

Cantidad de Error de API vs Puntuación

Mejores modelos por Tiempo de respuesta (promedio)

Mejores modelos por Costo desperdiciado estimado