AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs Qwen: Qwen3.5-122B-A10B

Rezumat

Comparație benchmark Seed-2.0-Lite vs Qwen3.5-122B-A10B: Seed-2.0-Lite conduce la scorul mediu cu 6.2 vs 5.3. Seed-2.0-Lite are costul de benchmark mai mic, $0.019 vs $0.020. Seed-2.0-Lite este mai rapid cu 2.49s vs 3.41s, cu rate de reușită de 46.0% vs 31.8%.

Model recomandat: Seed-2.0-Lite - Are cel mai puternic scor din această comparație (6.2) și cel mai bun echilibru între cost și timp de răspuns dintre toate cele 2 modele.

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-06-18

Metrică	Seed-2.0-Lite Seed-2.0-Lite none Lansare: 2026-02-14	Qwen3.5-122B-A10B Qwen3.5-122B-A10B none Lansare: 2026-02-24

Metrică	Seed-2.0-Lite Seed-2.0-Lite none Lansare: 2026-02-14	Qwen3.5-122B-A10B Qwen3.5-122B-A10B none Lansare: 2026-02-24
Scor	6.2	5.3
Rang	#92	#125
Fiabilitate	10.0	10.0
Consistență	8.4	9.6
Teste corecte
Rată de trecere pe încercare	46.0%	31.8%
Teste instabile	4	1
Rulări totale	63	63
Cost per rezultat	0.228	0.393
Cost total	$0.019	$0.020
Preț de intrare	$0.250 / 1M	$0.260 / 1M
Preț de ieșire	$2.000 / 1M	$2.080 / 1M
Total tokenuri de intrare	46,573	47,735
Tokenuri de ieșire	3,259	3,383
Tokenuri de raționament	0	0
Timp de răspuns (mediu)	2.49s	3.41s
Timp de răspuns (maxim)	6.70s	46.00s
Timp de răspuns (total)	52.26s	71.59s

Prezentare generare

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#92 Seed-2.0-Lite

none

Cost: $0.005
Timp: 83.8s
Tokenuri: 2,311 tok

#125 Qwen3.5-122B-A10B

none

Cost: $0.016
Timp: 44.5s
Tokenuri: 6,431 tok

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	3.0	5.9	16.7%	2		2.43s	894	709	0
Qwen3.5-122B-A10B	4.8	10.0	25.0%	0		1.59s	696	312	0

Programare	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	5.6	10.0	33.3%	0		2.83s	8,215	410	0
Qwen3.5-122B-A10B	3.7	7.0	22.2%	1		2.77s	7,913	693	0

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	3.0	10.0	0.0%	0		6.59s	16,215	498	0
Qwen3.5-122B-A10B	3.0	10.0	0.0%	0		46.00s	20,175	1,137	0

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	10.0	10.0	100.0%	0		1.82s	8,538	246	0
Qwen3.5-122B-A10B	10.0	10.0	100.0%	0		1.01s	7,794	243	0

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	3.6	7.2	22.2%	1		1.33s	939	17	0
Qwen3.5-122B-A10B	5.3	10.0	33.3%	0		465ms	789	15	0

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	10.0	10.0	100.0%	0		3.45s	570	294	0
Qwen3.5-122B-A10B	5.0	10.0	0.0%	0		1.12s	522	66	0

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	10.0	10.0	100.0%	0		1.06s	810	73	0
Qwen3.5-122B-A10B	6.3	10.0	50.0%	0		513ms	711	69	0

Rezolvare de puzzle-uri	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	5.3	7.2	44.4%	1		2.78s	858	709	0
Qwen3.5-122B-A10B	3.8	10.0	0.0%	0		1.00s	714	575	0

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	10.0	10.0	100.0%	0		3.94s	9,270	292	0
Qwen3.5-122B-A10B	10.0	10.0	100.0%	0		2.04s	8,211	264	0

Cultură generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	3.0	10.0	0.0%	0		1.96s	264	11	0
Qwen3.5-122B-A10B	3.0	10.0	0.0%	0		295ms	210	9	0

Comparație rapidă

Schimbă perechea de comparație