AI BENCHY Compare

Anthropic: Claude Sonnet 5 vs Qwen: Qwen3.6 27B

Resumen

Comparación benchmark de Claude Sonnet 5 vs Qwen3.6 27B: Qwen3.6 27B lidera en puntuación media con 6.6 vs 5.7. Claude Sonnet 5 tiene menor coste de benchmark con $0.287 vs $0.336. Claude Sonnet 5 es más rápido con 4.74s vs 59.71s, con tasas de acierto de 42.9% vs 60.3%.

Modelo recomendado: Claude Sonnet 5 - Ofrece el mejor equilibrio general: puntuación competitiva (5.7), menor coste que Qwen3.6 27B y tiempo de respuesta equilibrado.

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-06-30

Métrica	Claude Sonnet 5 Claude Sonnet 5 none Lanzamiento: 2026-06-30	Qwen3.6 27B Qwen3.6 27B medium Lanzamiento: 2026-04-20

Métrica	Claude Sonnet 5 Claude Sonnet 5 none Lanzamiento: 2026-06-30	Qwen3.6 27B Qwen3.6 27B medium Lanzamiento: 2026-04-20
Puntuación	5.7	6.6
Rango	#117	#83
Fiabilidad	10.0	10.0
Consistencia	8.6	8.2
Pruebas correctas
Tasa de aciertos por intento	42.9%	60.3%
Pruebas inestables	4	5
Ejecuciones totales	63	63
Costo por resultado	4.098	3.361
Costo total	$0.287	$0.336
Precio de entrada	$2.000 / 1M	$0.286 / 1M
Precio de salida	$10.000 / 1M	$2.400 / 1M
Total de tokens de entrada	76,797	39,376
Tokens de salida	13,325	16,189
Tokens de razonamiento	0	122,521
Tiempo de respuesta (promedio)	4.74s	59.71s
Tiempo de respuesta (máximo)	29.46s	168.22s
Tiempo de respuesta (total)	99.46s	1254.01s

Generación showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#117 Claude Sonnet 5

none

Coste: $0.061
Tiempo: 53.7s
Tokens: 6,172 tok

#83 Qwen3.6 27B

medium

Coste: $0.009
Tiempo: 39.6s
Tokens: 3,090 tok

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Claude Sonnet 5	5.3	10.0	25.0%	0		3.60s	834	1,813	0
Qwen3.6 27B	8.3	10.0	75.0%	0		12.62s	453	582	4,311

Programación	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Claude Sonnet 5	4.6	7.9	22.2%	1		3.67s	10,590	1,864	0
Qwen3.6 27B	7.7	10.0	66.7%	0		142.99s	5,051	7,968	43,367

Combinado	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Claude Sonnet 5	3.0	10.0	0.0%	0		29.46s	38,775	6,340	0
Qwen3.6 27B	7.0	3.7	66.7%	1		83.07s	15,104	2,088	14,689

Análisis y extracción de datos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Claude Sonnet 5	10.0	10.0	100.0%	0		3.01s	10,503	309	0
Qwen3.6 27B	3.5	1.4	50.0%	2		37.30s	7,778	568	9,404

Específico del dominio	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Claude Sonnet 5	5.3	7.2	44.4%	1		3.28s	975	933	0
Qwen3.6 27B	2.9	7.2	11.1%	1		73.38s	662	3,510	20,352

Inteligencia general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Claude Sonnet 5	4.7	3.1	33.3%	1		2.81s	708	272	0
Qwen3.6 27B	6.5	3.4	66.7%	1		39.53s	516	81	3,045

Seguimiento de instrucciones	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Claude Sonnet 5	6.4	10.0	50.0%	0		2.58s	909	103	0
Qwen3.6 27B	10.0	10.0	100.0%	0		37.96s	699	346	6,548

Resolución de acertijos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Claude Sonnet 5	6.0	7.4	55.6%	1		3.22s	894	778	0
Qwen3.6 27B	7.7	10.0	66.7%	0		61.14s	696	255	12,044

Llamada de herramientas	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Claude Sonnet 5	10.0	10.0	100.0%	0		6.80s	12,351	522	0
Qwen3.6 27B	10.0	10.0	100.0%	0		16.88s	8,213	390	2,954

Cultura general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Claude Sonnet 5	3.0	10.0	0.0%	0		4.31s	258	391	0
Qwen3.6 27B	3.0	10.0	0.0%	0		80.99s	204	401	5,807

Comparación rápida

Cambiar par de comparación

Gemini 3.1 Flash Lite PreviewlowvsQwen3.6 27Bmedium Gemini 3.1 Flash Lite PreviewnonevsQwen3.6 27Bmedium Gemini 3.1 Flash LitelowvsQwen3.6 27Bmedium Claude Sonnet 5nonevsNorth Mini CodemediumDisponible gratis Gemini 3.5 FlashminimalvsQwen3.6 27Bmedium GPT-5.5nonevsQwen3.6 27Bmedium Gemini 3 Flash PreviewnonevsQwen3.6 27Bmedium Seed-2.0-LitenonevsQwen3.6 27Bmedium Gemini 3.5 FlashnonevsQwen3.6 27Bmedium Gemini 2.5 FlashnonevsQwen3.6 27Bmedium Claude Sonnet 5nonevsGemini 3.1 Flash Liteminimal Gemini 3.1 Flash LiteminimalvsQwen3.6 27Bmedium