Ranking de modelos de Combinado

Mira qué modelos de IA rinden mejor en Combinado, cuáles se mantienen fiables y dónde aparecen las mayores diferencias. Ordenar por: Tiempo de respuesta (promedio) ↑.

Modelos mostrados

Promedio de Puntuación de Combinado

5.5

Mejor modelo

Gemini 3.5 Flash 3.0

Motivos de fallo

Con motivo de fallo Llamada de herramienta no válida91 Con motivo de fallo Respuesta incorrecta68 Con motivo de fallo Sin respuesta29 Con motivo de fallo Error de API26 Con motivo de fallo Tiempo agotado5 Con motivo de fallo Formato extra1 Con motivo de fallo No siguió las instrucciones1

210/210

Rango	Modelo	Empresa	Puntuación de Combinado	Puntuación	Costo total	Pruebas correctas	Tiempo de respuesta (promedio)
#79	Gemini 3.5 Flash none	Google	3.0	7.0	$1.079	0/2	0ms
Pruebas totales 2 Pruebas incorrectas 2 Costo total $1.079 Tiempo de respuesta (promedio) 0ms
#179	Ring-2.6-1T none	Inclusionai	3.0	4.8	$0.026	0/2	0ms
Pruebas totales 2 Pruebas incorrectas 2 Costo total $0.026 Tiempo de respuesta (promedio) 0ms
#181	Grok 4.20 Multi Agent Beta medium	X AI	1.5	4.8	$5.599	0/1	0ms
Pruebas totales 1 Pruebas incorrectas 1 Costo total $5.599 Tiempo de respuesta (promedio) 0ms
#202	Grok Build 0.1 none	X AI	1.5	4.0	$0.547	0/1	0ms
Pruebas totales 1 Pruebas incorrectas 1 Costo total $0.547 Tiempo de respuesta (promedio) 0ms
#204	Qwen3.5-9B medium	Qwen	3.0	3.8	$0.036	0/2	0ms
Pruebas totales 2 Pruebas incorrectas 2 Costo total $0.036 Tiempo de respuesta (promedio) 0ms
#206	gpt-oss-120b none	OpenAI	1.5	3.7	$0.010	0/1	0ms
Pruebas totales 1 Pruebas incorrectas 1 Costo total $0.010 Tiempo de respuesta (promedio) 0ms
#207	Nemotron 3 Nano Omni 30b A3b Reasoning medium	NVIDIA	1.5	3.4	$0.000	0/1	0ms
Pruebas totales 1 Pruebas incorrectas 1 Costo total $0.000 Tiempo de respuesta (promedio) 0ms
#208	Nemotron 3 Nano Omni 30b A3b Reasoning none	NVIDIA	1.5	3.2	$0.000	0/1	0ms
Pruebas totales 1 Pruebas incorrectas 1 Costo total $0.000 Tiempo de respuesta (promedio) 0ms
#209	Step 3.5 Flash none	Stepfun	1.5	2.3	$0.020	0/1	0ms
Pruebas totales 1 Pruebas incorrectas 1 Costo total $0.020 Tiempo de respuesta (promedio) 0ms
#210	LFM2-24B-A2B none	Liquid	1.5	2.2	$0.001	0/1	0ms
Pruebas totales 1 Pruebas incorrectas 1 Costo total $0.001 Tiempo de respuesta (promedio) 0ms
#205	Laguna Xs.2 none	Poolside	1.5	3.8	$0.004	0/1	2.01s
Pruebas totales 1 Pruebas incorrectas 1 Costo total $0.004 Tiempo de respuesta (promedio) 2.01s
#189	Mercury 2 none	Inception	3.0	4.6	$0.030	0/2	2.56s
Pruebas totales 2 Pruebas incorrectas 2 Costo total $0.030 Tiempo de respuesta (promedio) 2.56s
#200	MiMo-V2-Flash none	Xiaomi	1.5	4.0	$0.025	0/1	2.87s
Pruebas totales 1 Pruebas incorrectas 1 Costo total $0.025 Tiempo de respuesta (promedio) 2.87s
#203	Grok 4.1 Fast none	X AI	1.5	3.8	$0.008	0/1	3.33s
Pruebas totales 1 Pruebas incorrectas 1 Costo total $0.008 Tiempo de respuesta (promedio) 3.33s
#195	Elephant Alpha medium	Openrouter	1.5	4.3	$0.000	0/1	3.70s
Pruebas totales 1 Pruebas incorrectas 1 Costo total $0.000 Tiempo de respuesta (promedio) 3.70s

Ranking de Combinado

Filtrar modelos

Mejores modelos por Puntuación de Combinado

Puntuación de Combinado vs costo total

Mejores modelos por Tiempo de respuesta (promedio)