Ranking de modelos de Resolución de acertijos

Mira qué modelos de IA rinden mejor en Resolución de acertijos, cuáles se mantienen fiables y dónde aparecen las mayores diferencias. Ordenar por: Tiempo de respuesta (promedio) ↓.

Modelos mostrados

Promedio de Puntuación de Resolución de acertijos

6.7

Mejor modelo

Muse Spark 1.1 7.8

Motivos de fallo

Con motivo de fallo Respuesta incorrecta204 Con motivo de fallo No siguió las instrucciones90 Con motivo de fallo Error de API12 Con motivo de fallo Formato extra8 Con motivo de fallo Tiempo agotado5 Con motivo de fallo Sin respuesta3

216/216

Rango	Modelo	Empresa	Puntuación de Resolución de acertijos	Puntuación	Costo total	Pruebas correctas	Tiempo de respuesta (promedio)
#114	Ring-2.6-1T medium	Inclusionai	5.9	6.3	$0.103	1/3	20.7s
Pruebas totales 3 Pruebas incorrectas 2 Costo total $0.103 Tiempo de respuesta (promedio) 20.7s
#134	GPT-5 Nano medium	OpenAI	5.3	6.1	$0.114	1/3	20.6s
Pruebas totales 3 Pruebas incorrectas 2 Costo total $0.114 Tiempo de respuesta (promedio) 20.6s
#107	MiMo-V2.5 medium	Xiaomi	8.2	6.5	$0.082	2/3	20.3s
Pruebas totales 3 Pruebas incorrectas 1 Costo total $0.082 Tiempo de respuesta (promedio) 20.3s
#143	North Mini Code medium	Cohere	3.3	5.9	$0.000	0/3	19.7s
Pruebas totales 3 Pruebas incorrectas 3 Costo total $0.000 Tiempo de respuesta (promedio) 19.7s
#52	Grok Build 0.1 medium	X AI	7.7	7.6	$1.097	2/3	18.3s
Pruebas totales 3 Pruebas incorrectas 1 Costo total $1.097 Tiempo de respuesta (promedio) 18.3s
#76	Qwen3.5-122B-A10B medium	Qwen	10.0	7.1	$1.046	3/3	17.9s
Pruebas totales 3 Pruebas incorrectas 0 Costo total $1.046 Tiempo de respuesta (promedio) 17.9s
#74	Qwen3.5 Plus 2026-04-20 medium	Qwen	8.2	7.2	$0.317	2/3	17.7s
Pruebas totales 3 Pruebas incorrectas 1 Costo total $0.317 Tiempo de respuesta (promedio) 17.7s
#40	Qwen3.7 Plus medium	Qwen	10.0	7.9	$0.267	3/3	16.4s
Pruebas totales 3 Pruebas incorrectas 0 Costo total $0.267 Tiempo de respuesta (promedio) 16.4s
#29	GPT-5 Mini medium	OpenAI	5.6	8.1	$0.237	1/3	15.2s
Pruebas totales 3 Pruebas incorrectas 2 Costo total $0.237 Tiempo de respuesta (promedio) 15.2s
#48	GPT-5.6 Luna high	OpenAI	7.6	7.7	$1.017	2/3	14.6s
Pruebas totales 3 Pruebas incorrectas 1 Costo total $1.017 Tiempo de respuesta (promedio) 14.6s
#42	GLM 5.2 medium	Z.ai	8.2	7.8	$0.187	2/3	13.1s
Pruebas totales 3 Pruebas incorrectas 1 Costo total $0.187 Tiempo de respuesta (promedio) 13.1s
#200	GLM 4.7 Flash medium	Z.ai	2.9	4.3	$0.166	0/3	12.9s
Pruebas totales 3 Pruebas incorrectas 3 Costo total $0.166 Tiempo de respuesta (promedio) 12.9s
#194	Cobuddy medium	Baidu	3.6	4.7	$0.000	0/3	12.8s
Pruebas totales 3 Pruebas incorrectas 3 Costo total $0.000 Tiempo de respuesta (promedio) 12.8s
#46	GLM 5 medium	Z.ai	10.0	7.7	$0.307	3/3	11.3s
Pruebas totales 3 Pruebas incorrectas 0 Costo total $0.307 Tiempo de respuesta (promedio) 11.3s
#196	MiniMax M2.5 medium	Minimax	5.3	4.6	$0.340	1/3	11.2s
Pruebas totales 3 Pruebas incorrectas 2 Costo total $0.340 Tiempo de respuesta (promedio) 11.2s

Ranking de Resolución de acertijos

Filtrar modelos

Mejores modelos por Puntuación de Resolución de acertijos

Puntuación de Resolución de acertijos vs costo total

Mejores modelos por Tiempo de respuesta (promedio)