AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs Qwen: Qwen3.5-35B-A3B

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-03-12

Metrică	Seed-2.0-Lite Seed-2.0-Lite none Lansare: 2026-02-14	Qwen3.5-35B-A3B Qwen3.5-35B-A3B medium Lansare: 2026-02-24

Metrică	Seed-2.0-Lite Seed-2.0-Lite none Lansare: 2026-02-14	Qwen3.5-35B-A3B Qwen3.5-35B-A3B medium Lansare: 2026-02-24
Rang	#45	#39
Scor mediu	4.9	5.5
Consistență	7.4	6.3
Cost per rezultat	0.214	4.251
Cost total	$0.015	$0.341
Teste corecte
Rată de trecere pe încercare	56.3%	77.1%
Teste instabile	5	7
Rulări totale	48	48
Tokenuri de ieșire	2,743	5,495
Tokenuri de raționament	0	169,266
Timp de răspuns (mediu)	2.49s	43.93s
Timp de răspuns (maxim)	6.70s	106.00s
Timp de răspuns (total)	39.91s	702.85s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor mediu vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor mediu vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	10.0	4.6	22.2%	2		2.93s	703	0
Qwen3.5-35B-A3B	10.0	10.0	100.0%	0		21.75s	429	36,235

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	10.0	10.0	0.0%	0		6.59s	498	0
Qwen3.5-35B-A3B	10.0	1.6	66.7%	1		75.34s	775	12,485

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	9.9	10.0	100.0%	0		1.82s	246	0
Qwen3.5-35B-A3B	5.5	5.9	83.3%	1		59.33s	235	19,493

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	10.0	7.2	22.2%	1		1.33s	17	0
Qwen3.5-35B-A3B	10.0	4.4	44.5%	2		88.34s	41	46,368

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	10.0	10.0	100.0%	0		3.45s	294	0
Qwen3.5-35B-A3B	10.0	1.6	33.3%	1		30.30s	20	3,753

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	10.0	10.0	100.0%	0		1.06s	73	0
Qwen3.5-35B-A3B	10.0	10.0	100.0%	0		24.45s	97	17,361

Puzzle Solving	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	4.0	4.4	55.6%	2		2.46s	620	0
Qwen3.5-35B-A3B	4.0	4.4	77.8%	2		31.58s	3,589	32,206

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	10.0	10.0	100.0%	0		3.94s	292	0
Qwen3.5-35B-A3B	10.0	10.0	100.0%	0		4.65s	309	1,365

Comparație rapidă

Schimbă perechea de comparație

DeepSeek V3.2nonevsQwen3.5-35B-A3Bmedium Seed-2.0-LitenonevsGrok 4.20 Multi-Agent Betamedium Seed-2.0-Litenonevsgpt-oss-120bmediumDisponibil gratuit Seed-2.0-LitenonevsMiniMax M2.5medium Gemini 2.5 FlashnonevsQwen3.5-35B-A3Bmedium Seed-2.0-LitenonevsMercury 2medium Qwen3.5-35B-A3BmediumvsGLM 5none Seed-2.0-LitenonevsGPT-5 Nanomedium Seed-2.0-LitenonevsNemotron 3 Super 120b A12bmediumDisponibil gratuit Hunter AlphanonevsQwen3.5-35B-A3Bmedium Seed-2.0-LitenonevsHunter Alphamedium GPT-5.4nonevsQwen3.5-35B-A3Bmedium