Ranking de modelos de Combinado

Mira qué modelos de IA rinden mejor en Combinado, cuáles se mantienen fiables y dónde aparecen las mayores diferencias. Ordenar por: Tiempo de respuesta (promedio) ↑.

Modelos mostrados

Promedio de Puntuación de Combinado

5.5

Mejor modelo

Gemini 3.5 Flash 3.0

Motivos de fallo

Con motivo de fallo Llamada de herramienta no válida96 Con motivo de fallo Respuesta incorrecta71 Con motivo de fallo Sin respuesta33 Con motivo de fallo Error de API26 Con motivo de fallo Tiempo agotado5 Con motivo de fallo Formato extra1 Con motivo de fallo No siguió las instrucciones1

220/220

Rango	Modelo	Empresa	Puntuación de Combinado	Puntuación	Costo total	Pruebas correctas	Tiempo de respuesta (promedio)
#93	Gemini 3 Flash Preview none	Google	3.8	6.8	$0.085	0/2	12.4s
Pruebas totales 2 Pruebas incorrectas 2 Costo total $0.085 Tiempo de respuesta (promedio) 12.4s
#23	Grok 4.5 low	X AI	6.5	8.4	$0.935	1/2	12.8s
Pruebas totales 2 Pruebas incorrectas 1 Costo total $0.935 Tiempo de respuesta (promedio) 12.8s
#123	GPT-5.6 Luna low	OpenAI	2.8	6.2	$0.249	0/2	13.7s
Pruebas totales 2 Pruebas incorrectas 2 Costo total $0.249 Tiempo de respuesta (promedio) 13.7s
#38	GPT-5.6 Terra high	OpenAI	8.7	8.0	$1.055	1/2	13.7s
Pruebas totales 2 Pruebas incorrectas 1 Costo total $1.055 Tiempo de respuesta (promedio) 13.7s
#9	GPT-5.5 low	OpenAI	10.0	9.3	$1.253	2/2	13.7s
Pruebas totales 2 Pruebas incorrectas 0 Costo total $1.253 Tiempo de respuesta (promedio) 13.7s
#53	GLM 5 Turbo medium	Z.ai	5.0	7.6	$0.323	1/1	13.9s
Pruebas totales 1 Pruebas incorrectas 0 Costo total $0.323 Tiempo de respuesta (promedio) 13.9s
#34	GPT-5.2 Chat none	OpenAI	7.3	8.0	$0.604	1/2	13.9s
Pruebas totales 2 Pruebas incorrectas 1 Costo total $0.604 Tiempo de respuesta (promedio) 13.9s
#92	Gemini 3.5 Flash minimal	Google	3.0	6.8	$0.300	0/2	14.4s
Pruebas totales 2 Pruebas incorrectas 2 Costo total $0.300 Tiempo de respuesta (promedio) 14.4s
#5	GPT-5.6 Sol low	OpenAI	10.0	9.5	$0.971	2/2	14.6s
Pruebas totales 2 Pruebas incorrectas 0 Costo total $0.971 Tiempo de respuesta (promedio) 14.6s
#54	GPT-5.6 Luna medium	OpenAI	10.0	7.6	$0.352	2/2	14.6s
Pruebas totales 2 Pruebas incorrectas 0 Costo total $0.352 Tiempo de respuesta (promedio) 14.6s
#196	Qwen3 Coder Next medium	Qwen	3.0	4.7	$0.032	0/2	14.6s
Pruebas totales 2 Pruebas incorrectas 2 Costo total $0.032 Tiempo de respuesta (promedio) 14.6s
#189	GPT-5.4 Nano none	OpenAI	3.0	4.8	$0.041	0/2	14.7s
Pruebas totales 2 Pruebas incorrectas 2 Costo total $0.041 Tiempo de respuesta (promedio) 14.7s
#98	GLM 5V Turbo medium	Z.ai	3.4	6.7	$0.457	0/1	15.1s
Pruebas totales 1 Pruebas incorrectas 1 Costo total $0.457 Tiempo de respuesta (promedio) 15.1s
#58	GPT-5.3 Chat none	OpenAI	10.0	7.5	$0.571	2/2	15.1s
Pruebas totales 2 Pruebas incorrectas 0 Costo total $0.571 Tiempo de respuesta (promedio) 15.1s
#206	Hunter Alpha none	OpenRouter	1.5	4.2	$0.000	0/1	15.2s
Pruebas totales 1 Pruebas incorrectas 1 Costo total $0.000 Tiempo de respuesta (promedio) 15.2s

Ranking de Combinado

Filtrar modelos

Mejores modelos por Puntuación de Combinado

Puntuación de Combinado vs costo total

Mejores modelos por Tiempo de respuesta (promedio)