AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs OpenAI: GPT-5.4 Nano

Last updated at: 2026-03-17

Metric	Seed-2.0-Lite Seed-2.0-Lite none Release: 2026-02-14	GPT-5.4 Nano GPT-5.4 Nano medium Release: 2026-03-17

Metric	Seed-2.0-Lite Seed-2.0-Lite none Release: 2026-02-14	GPT-5.4 Nano GPT-5.4 Nano medium Release: 2026-03-17
Rank	#47	#28
Score	6.0	7.4
Consistency	7.6	9.0
Cost per result	0.215	0.769
Total Cost	$0.016	$0.077
Tests Correct
Attempt pass rate	52.9%	66.7%
Flaky tests	5	2
Total Runs	51	51
Output Tokens	2,749	2,474
Reasoning Tokens	0	54,516
Response Time (avg)	2.40s	11.08s
Response Time (max)	6.70s	94.06s
Response Time (total)	40.85s	188.39s

Top Models by Score

Score vs Total Cost

Response Time (avg)

Score vs Response Time (avg)

Total Output Tokens

Score vs Total Output Tokens

Category Breakdown

Anti-AI Tricks	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Seed-2.0-Lite	3.0	5.9	16.7%	2		2.43s	709	0
GPT-5.4 Nano	8.3	10.0	75.0%	0		4.52s	683	2,254

Combined	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Seed-2.0-Lite	3.0	10.0	0.0%	0		6.59s	498	0
GPT-5.4 Nano	9.8	10.0	100.0%	0		24.13s	349	5,719

Data parsing and extraction	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Seed-2.0-Lite	10.0	10.0	100.0%	0		1.82s	246	0
GPT-5.4 Nano	10.0	10.0	100.0%	0		2.54s	234	516

Domain specific	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Seed-2.0-Lite	3.6	7.2	22.2%	1		1.33s	17	0
GPT-5.4 Nano	5.9	7.2	55.6%	1		38.18s	60	43,325

General Intelligence	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Seed-2.0-Lite	10.0	10.0	100.0%	0		3.45s	294	0
GPT-5.4 Nano	4.5	10.0	0.0%	0		4.15s	179	443

Instructions following	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Seed-2.0-Lite	10.0	10.0	100.0%	0		1.06s	73	0
GPT-5.4 Nano	9.8	10.0	100.0%	0		1.88s	95	521

Puzzle Solving	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Seed-2.0-Lite	5.2	4.4	55.6%	2		2.46s	620	0
GPT-5.4 Nano	4.0	7.1	22.2%	1		3.65s	640	1,356

Tool Calling	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Seed-2.0-Lite	10.0	10.0	100.0%	0		3.94s	292	0
GPT-5.4 Nano	10.0	10.0	100.0%	0		7.71s	234	382

Quick Compare

Switch Comparison Pair

Seed-2.0-Litenonevsgpt-oss-120bmediumFree Available Seed-2.0-LitenonevsMiniMax M2.5mediumFree Available Claude Sonnet 4.6nonevsGPT-5.4 Nanomedium Seed-2.0-LitenonevsGrok 4.20 Multi-Agent Betamedium Seed-2.0-LitenonevsGPT-5 Nanomedium Seed-2.0-LitenonevsMercury 2medium Gemini 3.1 Flash Lite PreviewnonevsGPT-5.4 Nanomedium Seed-2.0-LitenonevsMistral Small 4medium Gemini 3 Flash PreviewnonevsGPT-5.4 Nanomedium Gemini 3.1 Flash Lite PreviewlowvsGPT-5.4 Nanomedium GPT-5.4 NanomediumvsQwen3.5 Plus 2026-02-15none GPT-5.4 NanomediumvsGLM 5none