AI BENCHY Compare

DeepSeek: DeepSeek V4 Flash vs Qwen: Qwen3.7 Max

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-06-04

Métrica	DeepSeek V4 Flash DeepSeek V4 Flash high Lanzamiento: 2026-04-24	Qwen3.7 Max Qwen3.7 Max none Lanzamiento: 2026-05-22

Métrica	DeepSeek V4 Flash DeepSeek V4 Flash high Lanzamiento: 2026-04-24	Qwen3.7 Max Qwen3.7 Max none Lanzamiento: 2026-05-22
Puntuación	7.7	7.7
Rango	#31	#34
Fiabilidad	10.0	10.0
Consistencia	8.5	10.0
Pruebas correctas
Tasa de aciertos por intento	74.6%	66.7%
Pruebas inestables	4	0
Ejecuciones totales	63	63
Costo por resultado	0.299	0.744
Costo total	$0.029	$0.054
Precio de entrada	$0.099 / 1M	$1.250 / 1M
Precio de salida	$0.197 / 1M	$3.750 / 1M
Total de tokens de entrada	39,745	37,107
Tokens de salida	10,310	1,994
Tokens de razonamiento	123,501	0
Tiempo de respuesta (promedio)	45.85s	1.30s
Tiempo de respuesta (máximo)	218.13s	3.92s
Tiempo de respuesta (total)	962.79s	27.21s

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
DeepSeek V4 Flash	8.3	10.0	75.0%	0		28.51s	540	140	7,770
Qwen3.7 Max	6.5	10.0	50.0%	0		1.08s	696	242	0

Programación	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
DeepSeek V4 Flash	7.8	10.0	66.7%	0		50.60s	7,279	395	34,862
Qwen3.7 Max	5.5	10.0	33.3%	0		1.35s	7,911	582	0

Combinado	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
DeepSeek V4 Flash	10.0	10.0	100.0%	0		76.57s	14,016	465	7,347
Qwen3.7 Max	3.0	10.0	0.0%	0		2.17s	9,549	171	0

Análisis y extracción de datos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
DeepSeek V4 Flash	10.0	10.0	100.0%	0		28.03s	7,290	201	1,179
Qwen3.7 Max	10.0	10.0	100.0%	0		1.35s	7,794	243	0

Específico del dominio	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
DeepSeek V4 Flash	4.1	4.4	44.5%	2		100.31s	666	27	59,249
Qwen3.7 Max	7.7	10.0	66.7%	0		975ms	789	15	0

Inteligencia general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
DeepSeek V4 Flash	6.1	3.1	66.7%	1		25.15s	471	79	632
Qwen3.7 Max	10.0	10.0	100.0%	0		1.04s	522	120	0

Seguimiento de instrucciones	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
DeepSeek V4 Flash	10.0	10.0	100.0%	0		15.36s	627	63	1,622
Qwen3.7 Max	10.0	10.0	100.0%	0		943ms	711	72	0

Resolución de acertijos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
DeepSeek V4 Flash	8.2	7.2	88.9%	1		26.11s	594	196	1,767
Qwen3.7 Max	10.0	10.0	100.0%	0		1.13s	714	314	0

Llamada de herramientas	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
DeepSeek V4 Flash	10.0	10.0	100.0%	0		74.73s	8,079	228	542
Qwen3.7 Max	10.0	10.0	100.0%	0		3.92s	8,211	222	0

Cultura general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
DeepSeek V4 Flash	3.0	10.0	0.0%	0		54.46s	183	8,516	8,531
Qwen3.7 Max	3.0	10.0	0.0%	0		856ms	210	13	0

Comparación rápida

Cambiar par de comparación

DeepSeek V4 FlashhighvsQwen3.5-27Bmedium DeepSeek V4 FlashhighvsGemini 3.5 Flashminimal DeepSeek V4 FlashhighvsQwen3.5-122B-A10Bmedium Gemini 3.5 FlashminimalvsQwen3.7 Maxnone Gemini 3 PRO PreviewmediumvsQwen3.7 Maxnone Gemma 4 26B A4BmediumDisponible gratisvsQwen3.7 Maxnone DeepSeek V4 FlashhighvsGemini 2.5 Flashmedium DeepSeek V4 FlashhighvsGemma 4 31BmediumDisponible gratis Qwen3.7 MaxnonevsGrok 4.3medium DeepSeek V4 FlashhighvsGemini 3 PRO Previewmedium DeepSeek V4 FlashhighvsQwen3.5 Plus 2026-04-20medium DeepSeek V4 FlashhighvsQwen3.6 Plusmedium