AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs OpenAI: GPT-5.4 Mini

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-03-17

Metrică	Seed-2.0-Lite Seed-2.0-Lite none Lansare: 2026-02-14	GPT-5.4 Mini GPT-5.4 Mini medium Lansare: 2026-03-17

Metrică	Seed-2.0-Lite Seed-2.0-Lite none Lansare: 2026-02-14	GPT-5.4 Mini GPT-5.4 Mini medium Lansare: 2026-03-17
Rang	#47	#34
Scor	6.0	7.1
Consistență	7.6	7.2
Cost per rezultat	0.215	3.610
Cost total	$0.016	$0.289
Teste corecte
Rată de trecere pe încercare	52.9%	68.6%
Teste instabile	5	6
Rulări totale	51	51
Tokenuri de ieșire	2,749	1,708
Tokenuri de raționament	0	58,019
Timp de răspuns (mediu)	2.40s	15.66s
Timp de răspuns (maxim)	6.70s	102.91s
Timp de răspuns (total)	40.85s	266.14s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	3.0	5.9	16.7%	2		2.43s	709	0
GPT-5.4 Mini	8.6	7.9	91.7%	1		4.05s	296	2,876

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	3.0	10.0	0.0%	0		6.59s	498	0
GPT-5.4 Mini	10.0	10.0	100.0%	0		17.81s	317	4,317

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	10.0	10.0	100.0%	0		1.82s	246	0
GPT-5.4 Mini	10.0	10.0	100.0%	0		2.43s	234	650

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	3.6	7.2	22.2%	1		1.33s	17	0
GPT-5.4 Mini	4.1	4.4	44.5%	2		65.31s	60	43,286

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	10.0	10.0	100.0%	0		3.45s	294	0
GPT-5.4 Mini	4.5	10.0	0.0%	0		3.72s	150	510

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	10.0	10.0	100.0%	0		1.06s	73	0
GPT-5.4 Mini	7.4	6.5	66.7%	1		2.50s	129	1,337

Puzzle Solving	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	5.2	4.4	55.6%	2		2.46s	620	0
GPT-5.4 Mini	6.8	7.9	55.6%	1		4.33s	271	2,449

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	10.0	10.0	100.0%	0		3.94s	292	0
GPT-5.4 Mini	4.7	1.6	66.7%	1		9.62s	251	2,594

Comparație rapidă

Schimbă perechea de comparație

Seed-2.0-Litenonevsgpt-oss-120bmediumDisponibil gratuit Seed-2.0-LitenonevsMiniMax M2.5mediumDisponibil gratuit Claude Sonnet 4.6nonevsGPT-5.4 Minimedium Seed-2.0-LitenonevsGrok 4.20 Multi-Agent Betamedium Seed-2.0-LitenonevsGPT-5 Nanomedium Seed-2.0-LitenonevsMercury 2medium GPT-5.4 MinimediumvsQwen3.5 Plus 2026-02-15none GPT-5.4 MinimediumvsGLM 5none Seed-2.0-LitenonevsMistral Small 4medium Gemini 3.1 Flash Lite PreviewnonevsGPT-5.4 Minimedium DeepSeek V3.2nonevsGPT-5.4 Minimedium Seed-2.0-LitenonevsGPT-5 Minimedium