Ranking de Inteligencia general x Error de API

Mira qué modelos de IA tienen más probabilidades de caer en Error de API dentro de Inteligencia general, para detectar puntos débiles más rápido. Ordenar por: Pruebas correctas ↓.

Modelos mostrados

Fallos totales

Modelo más afectado

Nemotron 3 Ultra 1

Motivos de fallo

No siguió las instrucciones78 Respuesta incorrecta59 Error de API12 Tiempo agotado4

Categorías

Programación45 Combinado26 Llamada de herramientas17 Análisis y extracción de datos14 Trucos anti-IA14 Cultura general13 Inteligencia general12 Resolución de acertijos12 Específico del dominio7 Seguimiento de instrucciones1

12/12

Rango	Modelo	Empresa	Cantidad de Error de API	Puntuación de categoría	Costo total	Pruebas correctas	Tiempo de respuesta (promedio)
#51	Nemotron 3 Ultra medium	NVIDIA	1	3.7	$0.774	0/1	2.52s
Pruebas totales 1 Pruebas incorrectas 1 Costo total $0.774 Tiempo de respuesta (promedio) 2.52s
#76	DeepSeek V3.2 medium	DeepSeek	1	3.4	$0.078	0/1	58.3s
Pruebas totales 1 Pruebas incorrectas 1 Costo total $0.078 Tiempo de respuesta (promedio) 58.3s
#135	Hy3 preview high	Tencent	1	3.0	$0.048	0/1	0ms
Pruebas totales 1 Pruebas incorrectas 1 Costo total $0.048 Tiempo de respuesta (promedio) 0ms
#153	Hy3 preview low	Tencent	1	3.0	$0.015	0/1	0ms
Pruebas totales 1 Pruebas incorrectas 1 Costo total $0.015 Tiempo de respuesta (promedio) 0ms
#173	DeepSeek V3.2 none	DeepSeek	1	4.7	$0.054	0/1	9.32s
Pruebas totales 1 Pruebas incorrectas 1 Costo total $0.054 Tiempo de respuesta (promedio) 9.32s
#175	Qwen3.6 Plus Preview medium	Qwen	1	3.0	$0.000	0/1	0ms
Pruebas totales 1 Pruebas incorrectas 1 Costo total $0.000 Tiempo de respuesta (promedio) 0ms
#186	Laguna M.1 medium	Poolside	1	3.0	$0.033	0/1	0ms
Pruebas totales 1 Pruebas incorrectas 1 Costo total $0.033 Tiempo de respuesta (promedio) 0ms
#192	Laguna M.1 none	Poolside	1	3.0	$0.009	0/1	0ms
Pruebas totales 1 Pruebas incorrectas 1 Costo total $0.009 Tiempo de respuesta (promedio) 0ms
#198	Laguna Xs.2 medium	Poolside	1	3.0	$0.015	0/1	0ms
Pruebas totales 1 Pruebas incorrectas 1 Costo total $0.015 Tiempo de respuesta (promedio) 0ms
#205	Laguna Xs.2 none	Poolside	1	3.0	$0.004	0/1	0ms
Pruebas totales 1 Pruebas incorrectas 1 Costo total $0.004 Tiempo de respuesta (promedio) 0ms
#207	Nemotron 3 Nano Omni 30b A3b Reasoning medium	NVIDIA	1	3.0	$0.000	0/1	0ms
Pruebas totales 1 Pruebas incorrectas 1 Costo total $0.000 Tiempo de respuesta (promedio) 0ms
#208	Nemotron 3 Nano Omni 30b A3b Reasoning none	NVIDIA	1	3.0	$0.000	0/1	0ms
Pruebas totales 1 Pruebas incorrectas 1 Costo total $0.000 Tiempo de respuesta (promedio) 0ms

Filtrar modelos

Mejores modelos por Cantidad de Error de API

Cantidad de Error de API vs Puntuación

Mejores modelos por Tiempo de respuesta (promedio)

Mejores modelos por Costo desperdiciado estimado

Inteligencia general: Error de API

Filtrar modelos

Mejores modelos por Cantidad de Error de API

Cantidad de Error de API vs Puntuación

Mejores modelos por Tiempo de respuesta (promedio)

Mejores modelos por Costo desperdiciado estimado