Ranking de modelos de Combinado

Mira qué modelos de IA rinden mejor en Combinado, cuáles se mantienen fiables y dónde aparecen las mayores diferencias. Ordenar por: Tiempo de respuesta (promedio) ↑.

Modelos mostrados

Promedio de Puntuación de Combinado

5.5

Mejor modelo

Gemini 3.5 Flash 3.0

Motivos de fallo

Con motivo de fallo Llamada de herramienta no válida91 Con motivo de fallo Respuesta incorrecta68 Con motivo de fallo Sin respuesta29 Con motivo de fallo Error de API26 Con motivo de fallo Tiempo agotado5 Con motivo de fallo Formato extra1 Con motivo de fallo No siguió las instrucciones1

210/210

Rango	Modelo	Empresa	Puntuación de Combinado	Puntuación	Costo total	Pruebas correctas	Tiempo de respuesta (promedio)
#193	Elephant Alpha none	Openrouter	1.5	4.3	$0.000	0/1	3.81s
Pruebas totales 1 Pruebas incorrectas 1 Costo total $0.000 Tiempo de respuesta (promedio) 3.81s
#192	Laguna M.1 none	Poolside	1.5	4.4	$0.009	0/1	4.32s
Pruebas totales 1 Pruebas incorrectas 1 Costo total $0.009 Tiempo de respuesta (promedio) 4.32s
#170	GLM 5 Turbo none	Z.ai	1.5	5.1	$0.047	0/1	4.89s
Pruebas totales 1 Pruebas incorrectas 1 Costo total $0.047 Tiempo de respuesta (promedio) 4.89s
#141	GLM 5 none	Z.ai	1.5	5.7	$0.041	0/1	4.98s
Pruebas totales 1 Pruebas incorrectas 1 Costo total $0.041 Tiempo de respuesta (promedio) 4.98s
#157	Mimo V2 Omni none	Xiaomi	1.5	5.5	$0.021	0/1	5.96s
Pruebas totales 1 Pruebas incorrectas 1 Costo total $0.021 Tiempo de respuesta (promedio) 5.96s
#197	Grok 4.20 none	X AI	1.5	4.1	$0.057	0/1	6.04s
Pruebas totales 1 Pruebas incorrectas 1 Costo total $0.057 Tiempo de respuesta (promedio) 6.04s
#136	GPT-5.4 Mini none	OpenAI	6.5	5.9	$0.095	1/2	6.22s
Pruebas totales 2 Pruebas incorrectas 1 Costo total $0.095 Tiempo de respuesta (promedio) 6.22s
#106	Gemini 3.1 Flash Lite Preview none	Google	3.0	6.4	$0.052	0/2	6.23s
Pruebas totales 2 Pruebas incorrectas 2 Costo total $0.052 Tiempo de respuesta (promedio) 6.23s
#174	GPT-4o-mini none	OpenAI	3.0	5.0	$0.010	0/2	6.32s
Pruebas totales 2 Pruebas incorrectas 2 Costo total $0.010 Tiempo de respuesta (promedio) 6.32s
#191	Grok 4.20 Beta none	X AI	1.5	4.4	$0.087	0/1	6.48s
Pruebas totales 1 Pruebas incorrectas 1 Costo total $0.087 Tiempo de respuesta (promedio) 6.48s
#145	GLM 5V Turbo none	Z.ai	1.5	5.6	$0.052	0/1	6.51s
Pruebas totales 1 Pruebas incorrectas 1 Costo total $0.052 Tiempo de respuesta (promedio) 6.51s
#147	Mimo V2 PRO none	Xiaomi	1.5	5.6	$0.045	0/1	6.58s
Pruebas totales 1 Pruebas incorrectas 1 Costo total $0.045 Tiempo de respuesta (promedio) 6.58s
#159	GPT-5.6 Luna none	OpenAI	3.2	5.4	$0.142	0/2	6.68s
Pruebas totales 2 Pruebas incorrectas 2 Costo total $0.142 Tiempo de respuesta (promedio) 6.68s
#132	GPT-5.6 Terra none	OpenAI	2.9	6.0	$0.349	0/2	7.02s
Pruebas totales 2 Pruebas incorrectas 2 Costo total $0.349 Tiempo de respuesta (promedio) 7.02s
#165	Mistral Small 4 none	Mistral	3.0	5.1	$0.022	0/2	7.44s
Pruebas totales 2 Pruebas incorrectas 2 Costo total $0.022 Tiempo de respuesta (promedio) 7.44s

Ranking de Combinado

Filtrar modelos

Mejores modelos por Puntuación de Combinado

Puntuación de Combinado vs costo total

Mejores modelos por Tiempo de respuesta (promedio)