AI BENCHY Compare

DeepSeek: DeepSeek V4 Flash vs Qwen: Qwen3.6 35B A3B

Resumen

Comparación benchmark de DeepSeek V4 Flash vs Qwen3.6 35B A3B: DeepSeek V4 Flash lidera en puntuación media con 7.7 vs 7.4. DeepSeek V4 Flash tiene menor coste de benchmark con $0.029 vs $0.146. Qwen3.6 35B A3B es más rápido con 18.08s vs 45.85s, con tasas de acierto de 74.6% vs 63.5%.

Modelo recomendado: DeepSeek V4 Flash - Tiene la mejor puntuación aquí (7.7) y cuesta aproximadamente 5.1x menos que Qwen3.6 35B A3B.

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-06-10

Métrica	DeepSeek V4 Flash DeepSeek V4 Flash high Lanzamiento: 2026-04-24	Qwen3.6 35B A3B Qwen3.6 35B A3B medium Lanzamiento: 2026-04-20

Métrica	DeepSeek V4 Flash DeepSeek V4 Flash high Lanzamiento: 2026-04-24	Qwen3.6 35B A3B Qwen3.6 35B A3B medium Lanzamiento: 2026-04-20
Puntuación	7.7	7.4
Rango	#32	#47
Fiabilidad	10.0	10.0
Consistencia	8.5	9.6
Pruebas correctas
Tasa de aciertos por intento	74.6%	63.5%
Pruebas inestables	4	1
Ejecuciones totales	63	63
Costo por resultado	0.299	1.094
Costo total	$0.029	$0.146
Precio de entrada	$0.099 / 1M	$0.140 / 1M
Precio de salida	$0.197 / 1M	$1.000 / 1M
Total de tokens de entrada	39,745	16,385
Tokens de salida	10,310	19,632
Tokens de razonamiento	123,501	130,219
Tiempo de respuesta (promedio)	45.85s	18.08s
Tiempo de respuesta (máximo)	218.13s	86.11s
Tiempo de respuesta (total)	962.79s	343.61s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#32 DeepSeek V4 Flash

high

Cost: $0.003
Time: 93.1s
Tokens: 7,926 tok

#47 Qwen3.6 35B A3B

medium

Invalid SVG

Cost: $0.000
Time: 300.0s
Tokens: 0 tok

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
DeepSeek V4 Flash	8.3	10.0	75.0%	0		28.51s	540	140	7,770
Qwen3.6 35B A3B	10.0	10.0	100.0%	0		6.02s	672	1,154	12,385

Programación	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
DeepSeek V4 Flash	7.8	10.0	66.7%	0		50.60s	7,279	395	34,862
Qwen3.6 35B A3B	7.7	10.0	66.7%	0		50.55s	5,051	7,929	37,223

Combinado	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
DeepSeek V4 Flash	10.0	10.0	100.0%	0		76.57s	14,016	465	7,347
Qwen3.6 35B A3B	3.0	10.0	0.0%	0		0ms	0	0	0

Análisis y extracción de datos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
DeepSeek V4 Flash	10.0	10.0	100.0%	0		28.03s	7,290	201	1,179
Qwen3.6 35B A3B	10.0	10.0	100.0%	0		12.99s	7,776	2,591	9,968

Específico del dominio	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
DeepSeek V4 Flash	4.1	4.4	44.5%	2		100.31s	666	27	59,249
Qwen3.6 35B A3B	5.3	7.2	44.4%	1		22.50s	771	6,193	39,116

Inteligencia general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
DeepSeek V4 Flash	6.1	3.1	66.7%	1		25.15s	471	79	632
Qwen3.6 35B A3B	4.4	9.9	0.0%	0		8.66s	516	129	4,569

Seguimiento de instrucciones	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
DeepSeek V4 Flash	10.0	10.0	100.0%	0		15.36s	627	63	1,622
Qwen3.6 35B A3B	10.0	10.0	100.0%	0		7.50s	699	219	7,404

Resolución de acertijos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
DeepSeek V4 Flash	8.2	7.2	88.9%	1		26.11s	594	196	1,767
Qwen3.6 35B A3B	8.0	10.0	66.7%	0		5.95s	696	655	9,228

Llamada de herramientas	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
DeepSeek V4 Flash	10.0	10.0	100.0%	0		74.73s	8,079	228	542
Qwen3.6 35B A3B	3.0	10.0	0.0%	0		0ms	0	0	0

Cultura general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
DeepSeek V4 Flash	3.0	10.0	0.0%	0		54.46s	183	8,516	8,531
Qwen3.6 35B A3B	3.0	10.0	0.0%	0		32.90s	204	762	10,326

Comparación rápida

Cambiar par de comparación