AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs Qwen: Qwen3.7 Plus

Rezumat

Comparație benchmark Seed-2.0-Lite vs Qwen3.7 Plus: Qwen3.7 Plus conduce la scorul mediu cu 6.4 vs 5.8. Seed-2.0-Lite are costul de benchmark mai mic, $0.019 vs $0.028. Seed-2.0-Lite este mai rapid cu 2.49s vs 2.85s, cu rate de reușită de 46.0% vs 47.6%.

Model recomandat: Seed-2.0-Lite - Scorul rămâne aproape de cel mai bun scor de aici (5.8 vs 6.4) și costă de aproximativ 1.5x mai puțin decât Qwen3.7 Plus.

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-06-10

Metrică	Seed-2.0-Lite Seed-2.0-Lite none Lansare: 2026-02-14	Qwen3.7 Plus Qwen3.7 Plus none Lansare: 2026-06-03

Metrică	Seed-2.0-Lite Seed-2.0-Lite none Lansare: 2026-02-14	Qwen3.7 Plus Qwen3.7 Plus none Lansare: 2026-06-03
Scor	5.8	6.4
Rang	#111	#89
Fiabilitate	10.0	10.0
Consistență	8.4	10.0
Teste corecte
Rată de trecere pe încercare	46.0%	47.6%
Teste instabile	4	0
Rulări totale	63	63
Cost per rezultat	0.228	0.276
Cost total	$0.019	$0.028
Preț de intrare	$0.250 / 1M	$0.400 / 1M
Preț de ieșire	$2.000 / 1M	$1.600 / 1M
Total tokenuri de intrare	46,573	42,510
Tokenuri de ieșire	3,259	6,578
Tokenuri de raționament	0	0
Timp de răspuns (mediu)	2.49s	2.85s
Timp de răspuns (maxim)	6.70s	29.38s
Timp de răspuns (total)	52.26s	59.86s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#111 Seed-2.0-Lite

none

Cost: $0.005
Time: 83.8s
Tokens: 2,311 tok

#89 Qwen3.7 Plus

none

Cost: $0.019
Time: 213.5s
Tokens: 11,960 tok

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	3.0	5.9	16.7%	2		2.43s	894	709	0
Qwen3.7 Plus	6.5	10.0	50.0%	0		1.38s	696	349	0

Programare	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	5.6	10.0	33.3%	0		2.83s	8,215	410	0
Qwen3.7 Plus	5.5	10.0	33.3%	0		2.15s	7,911	639	0

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	3.0	10.0	0.0%	0		6.59s	16,215	498	0
Qwen3.7 Plus	10.0	10.0	100.0%	0		29.38s	14,952	4,505	0

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	10.0	10.0	100.0%	0		1.82s	8,538	246	0
Qwen3.7 Plus	10.0	10.0	100.0%	0		1.43s	7,794	243	0

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	3.6	7.2	22.2%	1		1.33s	939	17	0
Qwen3.7 Plus	3.0	10.0	0.0%	0		868ms	789	18	0

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	10.0	10.0	100.0%	0		3.45s	570	294	0
Qwen3.7 Plus	5.3	10.0	0.0%	0		1.33s	522	78	0

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	10.0	10.0	100.0%	0		1.06s	810	73	0
Qwen3.7 Plus	6.3	10.0	50.0%	0		929ms	711	72	0

Rezolvare de puzzle-uri	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	5.3	7.2	44.4%	1		2.78s	858	709	0
Qwen3.7 Plus	7.7	10.0	66.7%	0		1.71s	714	443	0

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	10.0	10.0	100.0%	0		3.94s	9,270	292	0
Qwen3.7 Plus	10.0	10.0	100.0%	0		3.54s	8,211	222	0

Cultură generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	3.0	10.0	0.0%	0		1.96s	264	11	0
Qwen3.7 Plus	3.0	10.0	0.0%	0		1.21s	210	9	0

Comparație rapidă

Schimbă perechea de comparație

Gemini 3.1 Flash LiteminimalvsQwen3.7 Plusnone Seed-2.0-LitenonevsNemotron 3 SupermediumDisponibil gratuit CobuddymediumvsSeed-2.0-Litenone GPT-5 NanomediumvsQwen3.7 Plusnone Mercury 2mediumvsQwen3.7 Plusnone Seed-2.0-LitenonevsDeepSeek V4 Prohigh gpt-oss-120bmediumDisponibil gratuitvsQwen3.7 Plusnone Seed-2.0-Litenonevsgpt-oss-120bmediumDisponibil gratuit Kimi K2.5mediumvsQwen3.7 Plusnone Ring-2.6-1TmediumvsQwen3.7 Plusnone Seed-2.0-LitenonevsMiniMax M2.5medium DeepSeek V4 ProhighvsQwen3.7 Plusnone