ByteDance Seed: Seed-2.0-Lite vs Qwen: Qwen3.6 Plus

Scorul mediu este practic egal la 7.9 vs 7.8. Seed-2.0-Lite (medium) are costul de benchmark mai mic, $0.234 vs $0.405. Qwen3.6 Plus (medium) este mai rapid cu 43.12s vs 48.53s, cu rate de reușită de 74.2% vs 71.2%.

Model recomandatSeed-2.0-Lite (medium)Are cel mai bun scor aici (7.9) și costă de aproximativ 1.7x mai puțin decât Qwen3.6 Plus (medium).

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-07-25

Metrică	Seed-2.0-Lite Seed-2.0-Lite medium Lansare: 2026-02-14	Qwen3.6 Plus Qwen3.6 Plus medium Lansare: 2026-04-20

Metrică	Seed-2.0-Lite Seed-2.0-Lite medium Lansare: 2026-02-14	Qwen3.6 Plus Qwen3.6 Plus medium Lansare: 2026-04-20
Scor	7.9	7.8
Rang	#42	#44
Fiabilitate	10.0	10.0
Consistență	8.6	9.3
Teste corecte
Rată de trecere pe încercare	74.2%	71.2%
Teste instabile	4	2
Rulări totale	66	66
Cost per rezultat	1.669	1.514
Cost total	$0.234	$0.405
Preț de intrare	$0.250 / 1M	$0.325 / 1M
Preț de ieșire	$2.000 / 1M	$1.950 / 1M
Total tokenuri de intrare	129,897	97,689
Tokenuri de ieșire	12,533	6,412
Tokenuri de raționament	88,047	184,825
Timp de răspuns (mediu)	48.53s	43.12s
Timp de răspuns (maxim)	254.92s	291.55s
Timp de răspuns (total)	1067.74s	905.53s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#42 Seed-2.0-Lite

medium

Cost: $0.005
Timp: 86.7s
Tokenuri: 2,354 tok

#44 Qwen3.6 Plus

medium

Cost: $0.024
Timp: 219.0s
Tokenuri: 12,235 tok

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Categorie:

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	8.3	10.0	75.0%	0		17.99s	942	996	7,142
Qwen3.6 Plus	10.0	10.0	100.0%	0		9.90s	672	207	7,557

Programare	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	8.0	9.8	66.7%	0		156.74s	8,247	458	31,890
Qwen3.6 Plus	6.1	7.8	44.4%	1		153.12s	7,098	58	50,586

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	6.4	5.8	66.7%	1		58.52s	99,411	9,809	13,940
Qwen3.6 Plus	10.0	10.0	100.0%	0		163.25s	71,058	5,011	55,925

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	10.0	10.0	100.0%	0		9.07s	8,562	246	1,742
Qwen3.6 Plus	10.0	10.0	100.0%	0		14.95s	7,782	270	10,706

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	5.9	7.2	55.6%	1		88.74s	843	15	23,897
Qwen3.6 Plus	2.9	7.2	11.1%	1		29.59s	771	56	33,464

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	6.7	3.6	66.7%	1		18.25s	582	304	1,620
Qwen3.6 Plus	5.1	10.0	0.0%	0		27.05s	516	111	5,232

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	10.0	10.0	100.0%	0		7.26s	834	71	1,480
Qwen3.6 Plus	10.0	10.0	100.0%	0		7.54s	699	102	5,552

Rezolvare de puzzle-uri	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	9.0	7.9	88.9%	1		10.23s	894	403	3,285
Qwen3.6 Plus	10.0	10.0	100.0%	0		6.34s	696	309	6,712

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	10.0	10.0	100.0%	0		12.38s	9,306	222	1,011
Qwen3.6 Plus	10.0	10.0	100.0%	0		5.87s	8,193	267	1,330

Cultură generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	3.0	10.0	0.0%	0		48.32s	276	9	2,040
Qwen3.6 Plus	3.0	10.0	0.0%	0		47.51s	204	21	7,761

Comparație rapidă

Schimbă perechea de comparație

Seed-2.0-LitemediumvsGPT-5.6 Terrahigh Seed-2.0-LitemediumvsKimi K3max Claude Opus 4.8lowvsQwen3.6 Plusmedium GPT-5.6 TerrahighvsQwen3.6 Plusmedium Kimi K3maxvsQwen3.6 Plusmedium Claude Opus 4.8lowvsSeed-2.0-Litemedium Seed-2.0-LitemediumvsGLM 5.2high GPT-5.6 LunahighvsQwen3.6 Plusmedium Seed-2.0-LitemediumvsGPT-5.2 Chatnone Seed-2.0-LitemediumvsInklinghigh Seed-2.0-LitemediumvsGemini 3.5 Flash-Litehigh DeepSeek V4 FlashhighvsQwen3.6 Plusmedium