Seed-2.0-Mini (medium) vs Gemini 3.5 Flash (minimal)

Recommended model Gemini 3.5 Flash (minimal)

Its score stays close to the best score here (6.8 vs 7.0), while responding about 34.9x faster than Seed-2.0-Mini (medium).

Detailed comparison

Metric	Seed-2.0-Mini Seed-2.0-Mini medium Release: 2026-02-14	Gemini 3.5 Flash Gemini 3.5 Flash minimal Release: 2026-05-19

Metric	Seed-2.0-Mini Seed-2.0-Mini medium Release: 2026-02-14	Gemini 3.5 Flash Gemini 3.5 Flash minimal Release: 2026-05-19
Score	7.0	6.8
Rank	#90	#99
Reliability	8.5	10.0
Consistency	8.9	9.6
Tests Correct
Attempt pass rate	57.6%	65.2%
Flaky tests	3	1
Total Runs	66	66
Cost per result	0.917	2.138
Total Cost	$0.101	$0.300
Input Price	$0.100 / 1M	$1.500 / 1M
Output Price	$0.400 / 1M	$9.000 / 1M
Total Input Tokens	125,467	100,753
Output Tokens	10,778	16,454
Reasoning Tokens	209,856	0
Response Time (avg)	92.53s	2.65s
Response Time (max)	301.78s	25.26s
Response Time (total)	1665.50s	58.27s

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

medium

minimal

Category:

Anti-AI Tricks	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Seed-2.0-Mini	6.6	10.0	50.0%	0		74.75s	791	360	9,520
Gemini 3.5 Flash	6.5	10.0	50.0%	0		892ms	492	405	0

Coding	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Seed-2.0-Mini	5.5	9.8	33.3%	0		220.48s	3,823	464	34,964
Gemini 3.5 Flash	5.6	9.9	33.3%	0		2.75s	8,122	3,456	0

Combined	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Seed-2.0-Mini	7.3	5.8	83.3%	1		282.30s	100,096	8,627	143,688
Gemini 3.5 Flash	3.0	10.0	0.0%	0		14.41s	76,686	11,581	0

Data parsing and extraction	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Seed-2.0-Mini	10.0	10.0	100.0%	0		24.27s	8,568	246	2,743
Gemini 3.5 Flash	10.0	10.0	100.0%	0		1.66s	7,548	279	0

Domain specific	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Seed-2.0-Mini	3.0	10.0	0.0%	0		0ms	0	0	0
Gemini 3.5 Flash	10.0	10.0	100.0%	0		899ms	633	12	0

General Intelligence	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Seed-2.0-Mini	5.1	3.4	33.3%	1		36.65s	585	213	4,210
Gemini 3.5 Flash	10.0	10.0	100.0%	0		922ms	486	117	0

Instructions following	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Seed-2.0-Mini	10.0	10.0	100.0%	0		17.47s	840	69	2,050
Gemini 3.5 Flash	6.4	5.8	66.7%	1		893ms	615	76	0

Puzzle Solving	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Seed-2.0-Mini	8.2	7.2	88.9%	1		31.79s	903	527	5,667
Gemini 3.5 Flash	10.0	10.0	100.0%	0		1.45s	558	282	0

Tool Calling	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Seed-2.0-Mini	10.0	10.0	100.0%	0		88.68s	9,585	222	5,235
Gemini 3.5 Flash	10.0	10.0	100.0%	0		2.79s	5,457	234	0

Trivia	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Seed-2.0-Mini	3.0	10.0	0.0%	0		56.76s	276	50	1,779
Gemini 3.5 Flash	3.0	10.0	0.0%	0		1.76s	156	12	0

Switch Comparison Pair