AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs Qwen3.6 Plus Preview

Last updated at: 2026-05-01

Metric	Seed-2.0-Lite Seed-2.0-Lite none Release: 2026-02-14	Qwen3.6 Plus Preview Qwen3.6 Plus Preview medium Release: 2026-04-20 Free Available

Metric	Seed-2.0-Lite Seed-2.0-Lite none Release: 2026-02-14	Qwen3.6 Plus Preview Qwen3.6 Plus Preview medium Release: 2026-04-20 Free Available
Score	6.2	8.5
Rank	#80	#15
Reliability	N/A	N/A
Consistency	7.7	10.0
Tests Correct
Attempt pass rate	55.6%	76.5%
Flaky tests	5	0
Total Runs	54	49
Cost per result	0.200	0.000
Total Cost	$0.016	$0.000
Input Price	$0.250 / 1M	$0.000 / 1M
Output Price	$2.000 / 1M	$0.000 / 1M
Output Tokens	3,129	1,756
Reasoning Tokens	0	77,213
Response Time (avg)	2.53s	13.94s
Response Time (max)	6.70s	43.55s
Response Time (total)	45.46s	237.01s

Top Models by Score

Score vs Total Cost

Response Time (avg)

Score vs Response Time (avg)

Total Output Tokens

Score vs Total Output Tokens

Category Breakdown

Anti-AI Tricks	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Seed-2.0-Lite	3.0	5.9	16.7%	2		2.43s	709	0
Qwen3.6 Plus Preview	10.0	10.0	100.0%	0		9.90s	207	7,557

Coding	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Seed-2.0-Lite	10.0	10.0	100.0%	0		4.61s	380	0
Qwen3.6 Plus Preview	-	-	-	-	-	-	-	-

Combined	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Seed-2.0-Lite	3.0	10.0	0.0%	0		6.59s	498	0
Qwen3.6 Plus Preview	10.0	10.0	100.0%	0		34.95s	452	13,073

Data parsing and extraction	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Seed-2.0-Lite	10.0	10.0	100.0%	0		1.82s	246	0
Qwen3.6 Plus Preview	10.0	10.0	100.0%	0		14.95s	270	10,706

Domain specific	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Seed-2.0-Lite	3.6	7.2	22.2%	1		1.33s	17	0
Qwen3.6 Plus Preview	3.0	10.0	0.0%	0		22.08s	49	26,895

General Intelligence	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Seed-2.0-Lite	10.0	10.0	100.0%	0		3.45s	294	0
Qwen3.6 Plus Preview	5.1	10.0	0.0%	0		27.05s	111	5,232

Instructions following	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Seed-2.0-Lite	10.0	10.0	100.0%	0		1.06s	73	0
Qwen3.6 Plus Preview	10.0	10.0	100.0%	0		7.54s	102	5,552

Puzzle Solving	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Seed-2.0-Lite	5.2	4.4	55.6%	2		2.46s	620	0
Qwen3.6 Plus Preview	10.0	10.0	100.0%	0		6.11s	298	6,868

Tool Calling	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Seed-2.0-Lite	10.0	10.0	100.0%	0		3.94s	292	0
Qwen3.6 Plus Preview	10.0	10.0	100.0%	0		5.87s	267	1,330

Quick Compare

Switch Comparison Pair

Seed-2.0-LitenonevsLaguna Xs.2mediumFree Available Qwen3.6 Plus PreviewmediumFree AvailablevsHY3 PreviewhighFree Available Seed-2.0-LitenonevsLaguna M.1mediumFree Available Seed-2.0-LitenonevsGPT-5 Nanomedium Seed-2.0-Litenonevsgpt-oss-120bmediumFree Available Seed-2.0-LitenonevsOwl Alphamedium Seed-2.0-LitenonevsMercury 2medium Qwen3.6 Plus PreviewmediumFree AvailablevsHY3 PreviewlowFree Available Gemini 3 Flash PreviewnonevsQwen3.6 Plus PreviewmediumFree Available Gemini 3 Flash PreviewlowvsQwen3.6 Plus PreviewmediumFree Available Gemini 3.1 Flash Lite PreviewlowvsQwen3.6 Plus PreviewmediumFree Available Seed-2.0-LitenonevsNemotron 3 SupermediumFree Available