ByteDance Seed: Seed-2.0-Lite vs DeepSeek: DeepSeek V4 Flash

Seed-2.0-Lite (medium) conduce la scorul mediu cu 7.9 vs 7.7. DeepSeek V4 Flash (high) are costul de benchmark mai mic, $0.041 vs $0.234. Seed-2.0-Lite (medium) este mai rapid cu 48.53s vs 49.75s, cu rate de reușită de 74.2% vs 72.7%.

Model recomandatDeepSeek V4 Flash (high)Scorul rămâne aproape de cel mai bun scor de aici (7.7 vs 7.9) și costă de aproximativ 5.8x mai puțin decât Seed-2.0-Lite (medium).

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-07-25

Metrică	Seed-2.0-Lite Seed-2.0-Lite medium Lansare: 2026-02-14	DeepSeek V4 Flash DeepSeek V4 Flash high Lansare: 2026-04-24

Metrică	Seed-2.0-Lite Seed-2.0-Lite medium Lansare: 2026-02-14	DeepSeek V4 Flash DeepSeek V4 Flash high Lansare: 2026-04-24
Scor	7.9	7.7
Rang	#42	#52
Fiabilitate	10.0	10.0
Consistență	8.6	8.2
Teste corecte
Rată de trecere pe încercare	74.2%	72.7%
Teste instabile	4	5
Rulări totale	66	66
Cost per rezultat	1.669	0.402
Cost total	$0.234	$0.041
Preț de intrare	$0.250 / 1M	$0.094 / 1M
Preț de ieșire	$2.000 / 1M	$0.188 / 1M
Total tokenuri de intrare	129,897	108,392
Tokenuri de ieșire	12,533	14,478
Tokenuri de raționament	88,047	153,687
Timp de răspuns (mediu)	48.53s	49.75s
Timp de răspuns (maxim)	254.92s	218.13s
Timp de răspuns (total)	1067.74s	1094.41s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#42 Seed-2.0-Lite

medium

Cost: $0.005
Timp: 86.7s
Tokenuri: 2,354 tok

#52 DeepSeek V4 Flash

high

Cost: $0.003
Timp: 93.1s
Tokenuri: 7,926 tok

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Categorie:

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	8.3	10.0	75.0%	0		17.99s	942	996	7,142
DeepSeek V4 Flash	8.3	10.0	75.0%	0		28.51s	540	140	7,770

Programare	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	8.0	9.8	66.7%	0		156.74s	8,247	458	31,890
DeepSeek V4 Flash	7.8	10.0	66.7%	0		50.60s	7,279	395	34,862

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	6.4	5.8	66.7%	1		58.52s	99,411	9,809	13,940
DeepSeek V4 Flash	6.4	5.8	66.7%	1		104.10s	82,663	4,633	37,533

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	10.0	10.0	100.0%	0		9.07s	8,562	246	1,742
DeepSeek V4 Flash	10.0	10.0	100.0%	0		28.03s	7,290	201	1,179

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	5.9	7.2	55.6%	1		88.74s	843	15	23,897
DeepSeek V4 Flash	4.1	4.4	44.5%	2		100.31s	666	27	59,249

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	6.7	3.6	66.7%	1		18.25s	582	304	1,620
DeepSeek V4 Flash	6.1	3.1	66.7%	1		25.15s	471	79	632

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	10.0	10.0	100.0%	0		7.26s	834	71	1,480
DeepSeek V4 Flash	10.0	10.0	100.0%	0		15.36s	627	63	1,622

Rezolvare de puzzle-uri	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	9.0	7.9	88.9%	1		10.23s	894	403	3,285
DeepSeek V4 Flash	8.2	7.2	88.9%	1		26.11s	594	196	1,767

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	10.0	10.0	100.0%	0		12.38s	9,306	222	1,011
DeepSeek V4 Flash	10.0	10.0	100.0%	0		74.73s	8,079	228	542

Cultură generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	3.0	10.0	0.0%	0		48.32s	276	9	2,040
DeepSeek V4 Flash	3.0	10.0	0.0%	0		54.46s	183	8,516	8,531

Comparație rapidă

Schimbă perechea de comparație