Navegación
AI BENCHY
Advertise here

AI BENCHY Compare

Anthropic: Claude Sonnet 5 vs Qwen: Qwen3.6 Plus

Resumen

Comparación benchmark de Claude Sonnet 5 vs Qwen3.6 Plus: La puntuación media está prácticamente empatada en 7.9 vs 7.8. Qwen3.6 Plus tiene menor coste de benchmark con $0.294 vs $0.550. Claude Sonnet 5 es más rápido con 9.94s vs 30.70s, con tasas de acierto de 79.4% vs 69.8%.

Modelo recomendado: Claude Sonnet 5 - Tiene la mejor puntuación aquí (7.9) y responde aproximadamente 3.1x más rápido que Qwen3.6 Plus.

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-06-30

Métrica Claude Sonnet 5 Claude Sonnet 5 medium Lanzamiento: 2026-06-30 Qwen3.6 Plus Qwen3.6 Plus medium Lanzamiento: 2026-04-20
Puntuación 7.9 7.8
Rango #30 #31
Fiabilidad 10.0 10.0
Consistencia 9.0 9.3
Pruebas correctas
Tasa de aciertos por intento 79.4% 69.8%
Pruebas inestables 3 2
Ejecuciones totales 63 63
Costo por resultado 3.662 0.831
Costo total $0.550 $0.294
Precio de entrada $2.000 / 1M $0.325 / 1M
Precio de salida $10.000 / 1M $1.950 / 1M
Total de tokens de entrada 67,416 41,565
Tokens de salida 34,012 1,853
Tokens de razonamiento 7,673 141,973
Tiempo de respuesta (promedio) 9.94s 30.70s
Tiempo de respuesta (máximo) 56.94s 201.68s
Tiempo de respuesta (total) 208.71s 613.99s

Generación showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#30 Claude Sonnet 5

medium
Coste
$0.007
Tiempo
6.4s
Tokens
832 tok

#31 Qwen3.6 Plus

medium
Coste
$0.024
Tiempo
219.0s
Tokens
12,235 tok

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de entrada Tokens de salida Tokens de razonamiento
Claude Sonnet 5 10.0 10.0 100.0% 0 3.80s 834 1,220 446
Qwen3.6 Plus 10.0 10.0 100.0% 0 9.90s 672 207 7,557
Programación Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de entrada Tokens de salida Tokens de razonamiento
Claude Sonnet 5 9.0 7.9 88.9% 1 17.28s 10,590 13,153 2,379
Qwen3.6 Plus 6.1 7.8 44.4% 1 153.12s 7,098 58 50,586
Combinado Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de entrada Tokens de salida Tokens de razonamiento
Claude Sonnet 5 4.5 2.1 66.7% 1 37.01s 29,394 4,848 2,170
Qwen3.6 Plus 10.0 10.0 100.0% 0 34.95s 14,934 452 13,073
Análisis y extracción de datos Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de entrada Tokens de salida Tokens de razonamiento
Claude Sonnet 5 10.0 10.0 100.0% 0 3.16s 10,503 312 0
Qwen3.6 Plus 10.0 10.0 100.0% 0 14.95s 7,782 270 10,706
Específico del dominio Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de entrada Tokens de salida Tokens de razonamiento
Claude Sonnet 5 7.7 10.0 66.7% 0 20.38s 975 12,140 1,994
Qwen3.6 Plus 2.9 7.2 11.1% 1 29.59s 771 56 33,464
Inteligencia general Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de entrada Tokens de salida Tokens de razonamiento
Claude Sonnet 5 4.8 3.2 33.3% 1 4.32s 708 264 0
Qwen3.6 Plus 5.1 10.0 0.0% 0 27.05s 516 111 5,232
Seguimiento de instrucciones Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de entrada Tokens de salida Tokens de razonamiento
Claude Sonnet 5 9.9 10.0 100.0% 0 3.10s 909 318 269
Qwen3.6 Plus 10.0 10.0 100.0% 0 7.54s 699 102 5,552
Resolución de acertijos Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de entrada Tokens de salida Tokens de razonamiento
Claude Sonnet 5 7.7 10.0 66.7% 0 2.98s 894 407 121
Qwen3.6 Plus 10.0 10.0 100.0% 0 6.34s 696 309 6,712
Llamada de herramientas Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de entrada Tokens de salida Tokens de razonamiento
Claude Sonnet 5 10.0 10.0 100.0% 0 10.70s 12,351 433 90
Qwen3.6 Plus 10.0 10.0 100.0% 0 5.87s 8,193 267 1,330
Cultura general Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de entrada Tokens de salida Tokens de razonamiento
Claude Sonnet 5 3.0 10.0 0.0% 0 7.06s 258 917 204
Qwen3.6 Plus 3.0 10.0 0.0% 0 47.51s 204 21 7,761

Comparación rápida

Cambiar par de comparación