AI BENCHY Compare

Qwen: Qwen3.5-122B-A10B vs Qwen: Qwen3.5-27B

Resumen

Qwen3.5-27B lidera en puntuación media con 5.9 vs 5.3. Qwen3.5-27B tiene menor coste de benchmark con $0.015 vs $0.020. Qwen3.5-27B es más rápido con 1.68s vs 3.41s, con tasas de acierto de 31.8% vs 38.1%.

Modelo recomendadoQwen3.5-27BTiene la mejor puntuación aquí (5.9) y responde aproximadamente 2.0x más rápido que Qwen3.5-122B-A10B.

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-07-14

Métrica	Qwen3.5-122B-A10B Qwen3.5-122B-A10B none Lanzamiento: 2026-02-24	Qwen3.5-27B Qwen3.5-27B none Lanzamiento: 2026-02-24

Métrica	Qwen3.5-122B-A10B Qwen3.5-122B-A10B none Lanzamiento: 2026-02-24	Qwen3.5-27B Qwen3.5-27B none Lanzamiento: 2026-02-24
Puntuación	5.3	5.9
Rango	#152	#128
Fiabilidad	10.0	10.0
Consistencia	9.6	9.3
Pruebas correctas
Tasa de aciertos por intento	31.8%	38.1%
Pruebas inestables	1	2
Ejecuciones totales	63	63
Costo por resultado	0.393	0.249
Costo total	$0.020	$0.015
Precio de entrada	$0.260 / 1M	$0.195 / 1M
Precio de salida	$2.080 / 1M	$1.560 / 1M
Total de tokens de entrada	47,735	44,478
Tokens de salida	3,383	3,592
Tokens de razonamiento	0	0
Tiempo de respuesta (promedio)	3.41s	1.68s
Tiempo de respuesta (máximo)	46.00s	9.39s
Tiempo de respuesta (total)	71.59s	35.25s

Generación showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#152 Qwen3.5-122B-A10B

none

Coste: $0.016
Tiempo: 44.5s
Tokens: 6,431 tok

#128 Qwen3.5-27B

none

Coste: $0.007
Tiempo: 42.9s
Tokens: 4,273 tok

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Categoría:

Trucos anti-IA	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3.5-122B-A10B	4.8	10.0	25.0%	0		1.59s	696	312	0
Qwen3.5-27B	4.8	10.0	25.0%	0		788ms	696	267	0

Programación	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3.5-122B-A10B	3.7	7.0	22.2%	1		2.77s	7,913	693	0
Qwen3.5-27B	5.8	10.0	33.3%	0		1.80s	7,913	415	0

Combinado	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3.5-122B-A10B	3.0	10.0	0.0%	0		46.00s	20,175	1,137	0
Qwen3.5-27B	2.8	1.6	33.3%	1		9.39s	16,918	1,461	0

Análisis y extracción de datos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3.5-122B-A10B	10.0	10.0	100.0%	0		1.01s	7,794	243	0
Qwen3.5-27B	10.0	10.0	100.0%	0		1.43s	7,794	243	0

Específico del dominio	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3.5-122B-A10B	5.3	10.0	33.3%	0		465ms	789	15	0
Qwen3.5-27B	3.0	10.0	0.0%	0		540ms	789	15	0

Inteligencia general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3.5-122B-A10B	5.0	10.0	0.0%	0		1.12s	522	66	0
Qwen3.5-27B	5.0	10.0	0.0%	0		2.51s	522	126	0

Seguimiento de instrucciones	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3.5-122B-A10B	6.3	10.0	50.0%	0		513ms	711	69	0
Qwen3.5-27B	6.3	10.0	50.0%	0		1.03s	711	69	0

Resolución de acertijos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3.5-122B-A10B	3.8	10.0	0.0%	0		1.00s	714	575	0
Qwen3.5-27B	6.7	7.9	55.6%	1		1.38s	714	683	0

Llamada de herramientas	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3.5-122B-A10B	10.0	10.0	100.0%	0		2.04s	8,211	264	0
Qwen3.5-27B	10.0	10.0	100.0%	0		3.54s	8,211	303	0

Cultura general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Qwen3.5-122B-A10B	3.0	10.0	0.0%	0		295ms	210	9	0
Qwen3.5-27B	3.0	10.0	0.0%	0		599ms	210	10	0

Comparación rápida

Cambiar par de comparación

North Mini CodemediumDisponible gratisvsQwen3.5-27Bnone KAT-Coder-Air V2.5lowvsQwen3.5-27Bnone MiniMax M2.7mediumvsQwen3.5-122B-A10Bnone Mistral Small 4mediumvsQwen3.5-122B-A10Bnone Gemini 3.1 Flash LiteminimalvsQwen3.5-27Bnone KAT-Coder-Air V2.5mediumvsQwen3.5-27Bnone GPT-5.6 LunalowvsQwen3.5-27Bnone KAT-Coder-Air V2.5highvsQwen3.5-27Bnone CobuddymediumvsQwen3.5-122B-A10Bnone Gemma 4 31BmediumDisponible gratisvsQwen3.5-27Bnone Nemotron 3 SupermediumDisponible gratisvsQwen3.5-27Bnone Gemini 3.1 Flash LitelowvsQwen3.5-27Bnone