AI BENCHY Compare

DeepSeek: DeepSeek V4 Pro vs Qwen: Qwen3.5 Plus 2026-02-15

Resumen

Comparación benchmark de DeepSeek V4 Pro vs Qwen3.5 Plus 2026-02-15: Qwen3.5 Plus 2026-02-15 lidera en puntuación media con 8.0 vs 7.2. DeepSeek V4 Pro tiene menor coste de benchmark con $0.034 vs $0.310. DeepSeek V4 Pro es más rápido con 6.41s vs 73.79s, con tasas de acierto de 52.4% vs 73.0%.

Modelo recomendado: DeepSeek V4 Pro - Ofrece el mejor equilibrio general: puntuación competitiva (7.2), menor coste que Qwen3.5 Plus 2026-02-15 y tiempo de respuesta equilibrado.

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-06-18

Métrica	DeepSeek V4 Pro DeepSeek V4 Pro none Lanzamiento: 2026-04-24	Qwen3.5 Plus 2026-02-15 Qwen3.5 Plus 2026-02-15 medium Lanzamiento: 2026-02-15

Métrica	DeepSeek V4 Pro DeepSeek V4 Pro none Lanzamiento: 2026-04-24	Qwen3.5 Plus 2026-02-15 Qwen3.5 Plus 2026-02-15 medium Lanzamiento: 2026-02-15
Puntuación	7.2	8.0
Rango	#58	#28
Fiabilidad	9.9	10.0
Consistencia	8.8	8.8
Pruebas correctas
Tasa de aciertos por intento	52.4%	73.0%
Pruebas inestables	3	3
Ejecuciones totales	63	63
Costo por resultado	0.333	2.445
Costo total	$0.034	$0.310
Precio de entrada	$0.435 / 1M	$0.260 / 1M
Precio de salida	$0.870 / 1M	$1.560 / 1M
Total de tokens de entrada	53,558	40,918
Tokens de salida	11,424	2,159
Tokens de razonamiento	0	189,604
Tiempo de respuesta (promedio)	6.41s	73.79s
Tiempo de respuesta (máximo)	30.09s	266.69s
Tiempo de respuesta (total)	134.66s	1033.07s

Generación showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#58 DeepSeek V4 Pro

none

SVG inválido

Coste: $0.000
Tiempo: 300.0s
Tokens: 0 tok

#28 Qwen3.5 Plus 2026-02-15

medium

Coste: $0.011
Tiempo: 125.5s
Tokens: 7,040 tok

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Trucos anti-IA	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
DeepSeek V4 Pro	3.2	6.1	16.7%	2		4.02s	540	1,168	0
Qwen3.5 Plus 2026-02-15	8.2	7.9	83.3%	1		45.78s	672	205	21,236

Programación	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
DeepSeek V4 Pro	5.6	10.0	33.3%	0		13.38s	7,275	5,500	0
Qwen3.5 Plus 2026-02-15	6.6	7.1	44.4%	1		180.70s	6,950	420	80,595

Combinado	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
DeepSeek V4 Pro	9.5	10.0	100.0%	0		23.74s	27,529	2,235	0
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	0		46.85s	14,934	421	7,906

Análisis y extracción de datos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
DeepSeek V4 Pro	10.0	10.0	100.0%	0		4.61s	7,568	200	0
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	0		46.91s	7,782	270	14,916

Específico del dominio	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
DeepSeek V4 Pro	5.3	10.0	33.3%	0		3.72s	666	24	0
Qwen3.5 Plus 2026-02-15	5.3	10.0	33.3%	0		17.50s	444	35	16,680

Inteligencia general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
DeepSeek V4 Pro	5.0	10.0	0.0%	0		2.05s	471	126	0
Qwen3.5 Plus 2026-02-15	4.7	1.6	66.7%	1		79.86s	344	73	8,675

Seguimiento de instrucciones	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
DeepSeek V4 Pro	6.3	5.8	66.7%	1		4.12s	627	713	0
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	0		31.93s	699	101	7,704

Resolución de acertijos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
DeepSeek V4 Pro	10.0	10.0	100.0%	0		3.61s	594	442	0
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	0		32.50s	696	301	13,853

Llamada de herramientas	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
DeepSeek V4 Pro	10.0	10.0	100.0%	0		7.40s	8,105	328	0
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	0		7.54s	8,193	309	909

Cultura general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
DeepSeek V4 Pro	3.0	10.0	0.0%	0		5.76s	183	688	0
Qwen3.5 Plus 2026-02-15	3.0	10.0	0.0%	0		103.81s	204	24	17,130

Comparación rápida

Cambiar par de comparación