AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs OpenAI: GPT-5.5

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-04-24

Metrică	Seed-2.0-Lite Seed-2.0-Lite medium Lansare: 2026-02-14	GPT-5.5 GPT-5.5 medium Lansare: 2026-04-24

Metrică	Seed-2.0-Lite Seed-2.0-Lite medium Lansare: 2026-02-14	GPT-5.5 GPT-5.5 medium Lansare: 2026-04-24
Scor	8.6	9.0
Rang	#7	#5
Fiabilitate	N/D	N/D
Consistență	8.8	9.2
Teste corecte
Rată de trecere pe încercare	83.3%	87.0%
Teste instabile	3	2
Rulări totale	54	54
Cost per rezultat	0.926	19.226
Cost total	$0.121	$2.884
Preț de intrare	$0.250 / 1M	$5.000 / 1M
Preț de ieșire	$2.000 / 1M	$30.000 / 1M
Tokenuri de ieșire	3,257	1,920
Tokenuri de raționament	52,042	89,632
Timp de răspuns (mediu)	30.37s	32.75s
Timp de răspuns (maxim)	168.71s	332.10s
Timp de răspuns (total)	546.72s	589.59s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	8.3	10.0	75.0%	0		17.99s	996	7,142
GPT-5.5	10.0	10.0	100.0%	0		4.66s	250	1,335

Programare	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	10.0	10.0	100.0%	0		74.49s	436	7,319
GPT-5.5	10.0	10.0	100.0%	0		9.09s	318	1,391

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	10.0	10.0	100.0%	0		37.67s	506	4,299
GPT-5.5	10.0	10.0	100.0%	0		19.29s	312	2,841

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	10.0	10.0	100.0%	0		9.07s	246	1,742
GPT-5.5	10.0	10.0	100.0%	0		4.18s	234	593

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	5.9	7.2	55.6%	1		88.74s	15	23,897
GPT-5.5	5.3	7.2	44.4%	1		164.14s	67	79,625

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	6.7	3.6	66.7%	1		18.25s	304	1,620
GPT-5.5	10.0	10.0	100.0%	0		4.16s	138	223

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	10.0	10.0	100.0%	0		7.26s	71	1,480
GPT-5.5	10.0	10.0	100.0%	0		3.36s	93	538

Rezolvare de puzzle-uri	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	9.0	7.9	88.9%	1		11.03s	461	3,532
GPT-5.5	8.6	7.9	77.8%	1		6.78s	250	2,254

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	10.0	10.0	100.0%	0		12.38s	222	1,011
GPT-5.5	10.0	10.0	100.0%	0		10.57s	258	832

Comparație rapidă

Schimbă perechea de comparație

Seed-2.0-LitemediumvsHY3 PreviewhighDisponibil gratuit Gemini 3 Flash PreviewlowvsGPT-5.5medium Claude Opus 4.7nonevsGPT-5.5medium Seed-2.0-LitemediumvsGemini 3 Flash Previewlow Seed-2.0-LitemediumvsDeepSeek V4 Prohigh Seed-2.0-LitemediumvsHY3 PreviewlowDisponibil gratuit Seed-2.0-LitemediumvsGemini 3 Flash Previewnone Seed-2.0-LitemediumvsGemini 3.1 Flash Lite Previewlow GPT-5.5mediumvsHY3 PreviewhighDisponibil gratuit Claude Opus 4.7nonevsSeed-2.0-Litemedium Seed-2.0-LitemediumvsGPT-5.2 Chatnone Seed-2.0-LitemediumvsGemini 3.1 Flash Lite Previewnone