ByteDance Seed: Seed-2.0-Lite vs Qwen: Qwen3.7 Plus

La puntuación media está prácticamente empatada en 7.9 vs 7.9. Seed-2.0-Lite (medium) tiene menor coste de benchmark con $0.234 vs $0.267. Seed-2.0-Lite (medium) es más rápido con 48.53s vs 51.51s, con tasas de acierto de 74.2% vs 75.8%.

Modelo recomendadoSeed-2.0-Lite (medium)Tiene la puntuación más alta en esta comparación (7.9) y el mejor equilibrio general entre coste y tiempo de respuesta en los 2 modelos.

Benchmarks generados a partir de los suites de prueba de AI BENCHY en: 2026-07-18

Métrica	Seed-2.0-Lite Seed-2.0-Lite medium Lanzamiento: 2026-02-14	Qwen3.7 Plus Qwen3.7 Plus medium Lanzamiento: 2026-06-03

Métrica	Seed-2.0-Lite Seed-2.0-Lite medium Lanzamiento: 2026-02-14	Qwen3.7 Plus Qwen3.7 Plus medium Lanzamiento: 2026-06-03
Puntuación	7.9	7.9
Rango	#35	#36
Fiabilidad	10.0	10.0
Consistencia	8.6	8.9
Pruebas correctas
Tasa de aciertos por intento	74.2%	75.8%
Pruebas inestables	4	3
Ejecuciones totales	66	66
Costo por resultado	1.669	2.072
Costo total	$0.234	$0.267
Precio de entrada	$0.250 / 1M	$0.320 / 1M
Precio de salida	$2.000 / 1M	$1.280 / 1M
Total de tokens de entrada	129,897	115,233
Tokens de salida	12,533	6,162
Tokens de razonamiento	88,047	173,267
Tiempo de respuesta (promedio)	48.53s	51.51s
Tiempo de respuesta (máximo)	254.92s	315.30s
Tiempo de respuesta (total)	1067.74s	1133.15s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#35 Seed-2.0-Lite

medium

Coste: $0.005
Tiempo: 86.7s
Tokens: 2,354 tok

#36 Qwen3.7 Plus

medium

Coste: $0.018
Tiempo: 193.2s
Tokens: 10,821 tok

Mejores modelos por puntuación

Puntuación vs costo total

Tiempo de respuesta (promedio)

Puntuación vs Tiempo de respuesta (promedio)

Total de tokens de salida

Puntuación vs Total de tokens de salida

Desglose por categoría

Categoría:

Trucos anti-IA	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	8.3	10.0	75.0%	0		17.99s	942	996	7,142
Qwen3.7 Plus	10.0	10.0	100.0%	0		8.58s	672	195	5,065

Programación	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	8.0	9.8	66.7%	0		156.74s	8,247	458	31,890
Qwen3.7 Plus	6.1	6.6	55.6%	1		108.60s	6,472	414	43,576

Combinado	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	6.4	5.8	66.7%	1		58.52s	99,411	9,809	13,940
Qwen3.7 Plus	8.2	6.9	66.7%	1		190.27s	89,228	4,403	57,645

Análisis y extracción de datos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	10.0	10.0	100.0%	0		9.07s	8,562	246	1,742
Qwen3.7 Plus	10.0	10.0	100.0%	0		21.75s	7,782	270	6,713

Específico del dominio	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	5.9	7.2	55.6%	1		88.74s	843	15	23,897
Qwen3.7 Plus	3.6	7.2	22.2%	1		45.35s	771	57	27,073

Inteligencia general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	6.7	3.6	66.7%	1		18.25s	582	304	1,620
Qwen3.7 Plus	10.0	10.0	100.0%	0		25.48s	516	123	3,998

Seguimiento de instrucciones	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	10.0	10.0	100.0%	0		7.26s	834	71	1,480
Qwen3.7 Plus	10.0	10.0	100.0%	0		16.13s	699	102	5,013

Resolución de acertijos	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	9.0	7.9	88.9%	1		10.23s	894	403	3,285
Qwen3.7 Plus	10.0	10.0	100.0%	0		16.38s	696	280	7,312

Llamada de herramientas	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	10.0	10.0	100.0%	0		12.38s	9,306	222	1,011
Qwen3.7 Plus	10.0	10.0	100.0%	0		15.02s	8,193	292	1,831

Cultura general	Puntuación	Consistencia	Tasa de aciertos por intento	Pruebas inestables	Pruebas correctas	Tiempo de respuesta (promedio)	Tokens de entrada	Tokens de salida	Tokens de razonamiento
Seed-2.0-Lite	3.0	10.0	0.0%	0		48.32s	276	9	2,040
Qwen3.7 Plus	3.0	10.0	0.0%	0		91.07s	204	26	15,041

Comparación rápida

Cambiar par de comparación

Seed-2.0-LitemediumvsGPT-5.6 Terrahigh Seed-2.0-LitemediumvsKimi K3max GPT-5.6 TerrahighvsQwen3.7 Plusmedium Kimi K3maxvsQwen3.7 Plusmedium Claude Opus 4.8lowvsQwen3.7 Plusmedium Claude Opus 4.8lowvsSeed-2.0-Litemedium Seed-2.0-LitemediumvsGLM 5.2high Seed-2.0-LitemediumvsGPT-5.2 Chatnone Seed-2.0-LitemediumvsInklinghigh Qwen3.7 PlusmediumvsGLM 5.2high GPT-5.2 ChatnonevsQwen3.7 Plusmedium GPT-5.6 LunahighvsQwen3.7 Plusmedium