AI BENCHY Compare

ByteDance Seed: Seed-2.0-Mini vs Qwen: Qwen3.5-35B-A3B

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-05-29

Metrică	Seed-2.0-Mini Seed-2.0-Mini medium Lansare: 2026-02-14	Qwen3.5-35B-A3B Qwen3.5-35B-A3B medium Lansare: 2026-02-24

Metrică	Seed-2.0-Mini Seed-2.0-Mini medium Lansare: 2026-02-14	Qwen3.5-35B-A3B Qwen3.5-35B-A3B medium Lansare: 2026-02-24
Scor	7.1	7.3
Rang	#75	#68
Fiabilitate	10.0	10.0
Consistență	9.2	7.5
Teste corecte
Rată de trecere pe încercare	60.0%	73.3%
Teste instabile	2	6
Rulări totale	60	60
Cost per rezultat	0.397	4.865
Cost total	$0.044	$0.536
Preț de intrare	$0.100 / 1M	$0.139 / 1M
Preț de ieșire	$0.400 / 1M	$1.000 / 1M
Tokenuri de ieșire	2,555	31,242
Tokenuri de raționament	95,974	330,546
Timp de răspuns (mediu)	80.22s	69.66s
Timp de răspuns (maxim)	262.83s	409.98s
Timp de răspuns (total)	1363.72s	1393.17s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Mini	6.6	10.0	50.0%	0		74.75s	360	9,520
Qwen3.5-35B-A3B	10.0	10.0	100.0%	0		21.13s	798	42,652

Programare	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Mini	7.1	9.8	50.0%	0		220.48s	464	34,964
Qwen3.5-35B-A3B	6.5	10.0	50.0%	0		244.54s	14,456	88,431

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Mini	10.0	10.0	100.0%	0		262.83s	404	29,806
Qwen3.5-35B-A3B	4.7	1.6	66.7%	1		75.34s	775	12,485

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Mini	10.0	10.0	100.0%	0		24.27s	246	2,743
Qwen3.5-35B-A3B	7.3	5.9	83.3%	1		59.33s	235	19,493

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Mini	3.0	10.0	0.0%	0		0ms	0	0
Qwen3.5-35B-A3B	4.1	4.4	44.5%	2		88.34s	41	46,368

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Mini	5.1	3.4	33.3%	1		36.65s	213	4,210
Qwen3.5-35B-A3B	2.8	1.6	33.3%	1		30.30s	20	3,753

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Mini	10.0	10.0	100.0%	0		17.47s	69	2,050
Qwen3.5-35B-A3B	10.0	10.0	100.0%	0		24.45s	97	17,361

Rezolvare de puzzle-uri	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Mini	8.2	7.2	88.9%	1		31.79s	527	5,667
Qwen3.5-35B-A3B	8.2	7.2	88.9%	1		33.13s	3,592	26,585

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Mini	10.0	10.0	100.0%	0		88.68s	222	5,235
Qwen3.5-35B-A3B	10.0	10.0	100.0%	0		4.65s	309	1,365

Cultură generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Mini	3.0	10.0	0.0%	0		56.76s	50	1,779
Qwen3.5-35B-A3B	3.0	10.0	0.0%	0		177.35s	10,919	72,053

Comparație rapidă

Schimbă perechea de comparație

Seed-2.0-MinimediumvsQwen3.6 Max Previewnone Claude Opus 4.8nonevsQwen3.5-35B-A3Bmedium Ring-2.6-1TnonevsQwen3.5-35B-A3Bmedium Seed-2.0-MinimediumvsStep 3.7 Flashhigh Claude Sonnet 4.6nonevsSeed-2.0-Minimedium Seed-2.0-MinimediumvsDeepSeek V4 Prohigh Qwen3.5-35B-A3BmediumvsStep 3.7 Flashhigh Qwen3.5-35B-A3BmediumvsStep 3.7 Flashlow Seed-2.0-MinimediumvsRing-2.6-1Tnone GPT-5.3 ChatnonevsQwen3.5-35B-A3Bmedium Gemini 3.1 Flash LitelowvsQwen3.5-35B-A3Bmedium Claude Opus 4.8nonevsSeed-2.0-Minimedium