AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs Google: Gemini 2.5 Flash

Summary

Seed-2.0-Lite vs Gemini 2.5 Flash benchmark comparison: Seed-2.0-Lite leads on average score with 8.5 vs 8.2. Seed-2.0-Lite has the lower benchmark cost at $0.175 vs $0.379. Gemini 2.5 Flash is faster at 15.49s vs 47.07s, with pass rates of 76.2% vs 69.8%.

Recommended model: Seed-2.0-Lite - It has the best score here (8.5), while costing about 2.2x less than Gemini 2.5 Flash.

Last updated at: 2026-06-18

Metric	Seed-2.0-Lite Seed-2.0-Lite medium Release: 2026-02-14	Gemini 2.5 Flash Gemini 2.5 Flash medium Release: 2025-06-17

Metric	Seed-2.0-Lite Seed-2.0-Lite medium Release: 2026-02-14	Gemini 2.5 Flash Gemini 2.5 Flash medium Release: 2025-06-17
Score	8.5	8.2
Rank	#18	#24
Reliability	10.0	10.0
Consistency	9.0	9.6
Tests Correct
Attempt pass rate	76.2%	69.8%
Flaky tests	3	1
Total Runs	63	63
Cost per result	1.250	2.701
Total Cost	$0.175	$0.379
Input Price	$0.250 / 1M	$0.300 / 1M
Output Price	$2.000 / 1M	$2.500 / 1M
Total Input Tokens	46,740	34,476
Output Tokens	3,230	1,930
Reasoning Tokens	78,406	145,145
Response Time (avg)	47.07s	15.49s
Response Time (max)	254.92s	95.48s
Response Time (total)	988.37s	325.39s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#18 Seed-2.0-Lite

medium

Cost: $0.005
Time: 86.7s
Tokens: 2,354 tok

#24 Gemini 2.5 Flash

medium

Invalid SVG

Cost: $0.000
Time: 274.0s
Tokens: 0 tok

Top Models by Score

Score vs Total Cost

Response Time (avg)

Score vs Response Time (avg)

Total Output Tokens

Score vs Total Output Tokens

Category Breakdown

Anti-AI Tricks	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Seed-2.0-Lite	8.3	10.0	75.0%	0		17.99s	942	996	7,142
Gemini 2.5 Flash	8.4	10.0	75.0%	0		6.30s	492	255	10,233

Coding	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Seed-2.0-Lite	8.0	9.8	66.7%	0		156.74s	8,247	458	31,890
Gemini 2.5 Flash	7.8	10.0	66.7%	0		41.01s	6,669	543	32,303

Combined	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Seed-2.0-Lite	10.0	10.0	100.0%	0		37.67s	16,254	506	4,299
Gemini 2.5 Flash	10.0	10.0	100.0%	0		28.44s	12,522	303	11,922

Data parsing and extraction	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Seed-2.0-Lite	10.0	10.0	100.0%	0		9.07s	8,562	246	1,742
Gemini 2.5 Flash	10.0	10.0	100.0%	0		4.06s	7,257	279	2,325

Domain specific	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Seed-2.0-Lite	5.9	7.2	55.6%	1		88.74s	843	15	23,897
Gemini 2.5 Flash	5.9	7.2	55.6%	1		37.34s	633	18	80,702

General Intelligence	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Seed-2.0-Lite	6.7	3.6	66.7%	1		18.25s	582	304	1,620
Gemini 2.5 Flash	4.8	10.0	0.0%	0		4.86s	486	92	1,899

Instructions following	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Seed-2.0-Lite	10.0	10.0	100.0%	0		7.26s	834	71	1,480
Gemini 2.5 Flash	9.8	10.0	100.0%	0		2.62s	615	69	1,203

Puzzle Solving	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Seed-2.0-Lite	9.0	7.9	88.9%	1		10.23s	894	403	3,285
Gemini 2.5 Flash	7.7	10.0	66.7%	0		3.18s	558	126	2,499

Tool Calling	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Seed-2.0-Lite	10.0	10.0	100.0%	0		12.38s	9,306	222	1,011
Gemini 2.5 Flash	10.0	10.0	100.0%	0		6.20s	5,088	234	1,140

Trivia	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Seed-2.0-Lite	3.0	10.0	0.0%	0		48.32s	276	9	2,040
Gemini 2.5 Flash	3.0	10.0	0.0%	0		2.76s	156	11	919

Quick Compare

Switch Comparison Pair

Seed-2.0-LitemediumvsGPT-5.2 Chatnone DeepSeek V4 FlashhighvsGemini 2.5 Flashmedium Seed-2.0-LitemediumvsDeepSeek V4 Flashhigh Gemini 2.5 FlashmediumvsGPT-5.2 Chatnone Gemini 2.5 FlashmediumvsStep 3.7 Flashlow DeepSeek V4 ProhighvsGemini 2.5 Flashmedium Gemini 2.5 FlashmediumvsGPT-5.3 Chatnone Seed-2.0-LitemediumvsGemini 3.5 Flashlow Seed-2.0-LitemediumvsStep 3.7 Flashlow Seed-2.0-LitemediumvsGPT-5.5low Seed-2.0-LitemediumvsDeepSeek V4 Prohigh Claude Sonnet 4.6nonevsGemini 2.5 Flashmedium