Navegación
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

DeepSeek: DeepSeek V3.2 vs Qwen: Qwen3.6 27B

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-05-22

Métrica DeepSeek V3.2 DeepSeek V3.2 medium Lanzamiento: 2025-12-01 Qwen3.6 27B Qwen3.6 27B medium Lanzamiento: 2026-04-20
Puntuación 7.0 6.6
Rango #71 #83
Fiabilidad 9.1 9.9
Consistencia 7.6 8.1
Pruebas correctas
Tasa de aciertos por intento 69.2% 58.3%
Pruebas inestables 6 5
Ejecuciones totales 60 60
Costo por resultado 0.334 3.015
Costo total $0.037 $0.272
Precio de entrada $0.252 / 1M $0.317 / 1M
Precio de salida $0.378 / 1M $3.200 / 1M
Tokens de salida 7,049 13,007
Tokens de razonamiento 68,203 105,697
Tiempo de respuesta (promedio) 53.21s 57.65s
Tiempo de respuesta (máximo) 189.03s 168.22s
Tiempo de respuesta (total) 1064.26s 1153.04s

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
DeepSeek V3.2 9.2 10.0 100.0% 0 24.23s 3,247 6,953
Qwen3.6 27B 8.3 10.0 75.0% 0 12.62s 582 4,311
Programación Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
DeepSeek V3.2 3.9 5.8 33.3% 1 184.97s 640 21,230
Qwen3.6 27B 6.6 10.0 50.0% 0 165.39s 4,760 26,668
Combinado Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
DeepSeek V3.2 10.0 10.0 100.0% 0 93.11s 571 6,296
Qwen3.6 27B 7.0 3.7 66.7% 1 83.07s 2,088 14,689
Análisis y extracción de datos Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
DeepSeek V3.2 10.0 10.0 100.0% 0 36.09s 207 7,693
Qwen3.6 27B 3.5 1.4 50.0% 2 37.30s 568 9,404
Específico del dominio Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
DeepSeek V3.2 2.9 4.4 22.2% 2 24.27s 21 6,838
Qwen3.6 27B 2.9 7.2 11.1% 1 73.38s 3,510 20,352
Inteligencia general Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
DeepSeek V3.2 3.8 2.5 50.0% 1 58.29s 49 2,189
Qwen3.6 27B 6.5 3.4 66.7% 1 39.53s 81 3,045
Seguimiento de instrucciones Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
DeepSeek V3.2 10.0 10.0 100.0% 0 35.78s 1,397 2,845
Qwen3.6 27B 10.0 10.0 100.0% 0 37.96s 346 6,548
Resolución de acertijos Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
DeepSeek V3.2 6.7 5.0 66.7% 2 36.87s 390 6,281
Qwen3.6 27B 7.7 10.0 66.7% 0 60.21s 281 11,919
Llamada de herramientas Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
DeepSeek V3.2 10.0 10.0 100.0% 0 34.81s 507 859
Qwen3.6 27B 10.0 10.0 100.0% 0 16.88s 390 2,954
Cultura general Puntuación Consistencia Tasa de aciertos por intento Pruebas inestables Pruebas correctas Tiempo de respuesta (promedio) Tokens de salida Tokens de razonamiento
DeepSeek V3.2 3.0 10.0 0.0% 0 83.99s 20 7,019
Qwen3.6 27B 3.0 10.0 0.0% 0 80.99s 401 5,807

Comparación rápida

Cambiar par de comparación