Compară Grafice Metodologie

Limbă:

❤️ Made by XCS

AI BENCHY Compare

ByteDance Seed: Seed-2.0-Mini vs OpenAI: GPT-5.3 Chat

Compară:

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-03-06

Metrică	ByteDance Seed: Seed-2.0-Mini medium Lansare: 2026-02-14	OpenAI: GPT-5.3 Chat none Lansare: 2026-03-03
Rang	#23	#19
Scor mediu	6.9	7.3
Consistență	9.1	8.5
Cost per rezultat	0.280	3.163
Cost total	$0.028	$0.317
Teste corecte
Rată de trecere pe încercare	68.8%	70.8%
Teste instabile	2	3
common.totalRuns	48 (16 x 3)	48 (16 x 3)
Tokenuri de ieșire	1,965	19,272
Tokenuri de raționament	58,456	0
Timp de răspuns (mediu)	65.09s	5.96s
Timp de răspuns (maxim)	262.83s	18.33s
Timp de răspuns (total)	846.14s	95.30s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor mediu vs Timp de răspuns (mediu)

Defalcare pe categorii

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
ByteDance Seed: Seed-2.0-Mini	7.0	10.0	66.7%	0		98.99s	354	9,352
OpenAI: GPT-5.3 Chat	7.3	7.5	77.8%	1		4.72s	3,091	0

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
ByteDance Seed: Seed-2.0-Mini	10.0	10.0	100.0%	0		262.83s	404	29,806
OpenAI: GPT-5.3 Chat	10.0	10.0	100.0%	0		11.96s	2,614	0

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
ByteDance Seed: Seed-2.0-Mini	9.9	10.0	100.0%	0		24.27s	246	2,743
OpenAI: GPT-5.3 Chat	9.9	10.0	100.0%	0		2.21s	942	0

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
ByteDance Seed: Seed-2.0-Mini	10.0	10.0	0.0%	0		0ms	0	0
OpenAI: GPT-5.3 Chat	10.0	4.4	33.3%	2		13.01s	8,264	0

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
ByteDance Seed: Seed-2.0-Mini	6.0	3.4	33.3%	1		36.65s	213	4,210
OpenAI: GPT-5.3 Chat	4.0	10.0	0.0%	0		1.99s	319	0

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
ByteDance Seed: Seed-2.0-Mini	10.0	10.0	100.0%	0		17.47s	69	2,050
OpenAI: GPT-5.3 Chat	9.0	10.0	50.0%	0		3.29s	1,455	0

Puzzle Solving	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
ByteDance Seed: Seed-2.0-Mini	7.0	7.2	88.9%	1		25.85s	457	5,060
OpenAI: GPT-5.3 Chat	10.0	10.0	100.0%	0		2.93s	1,726	0

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
ByteDance Seed: Seed-2.0-Mini	10.0	10.0	100.0%	0		88.68s	222	5,235
OpenAI: GPT-5.3 Chat	10.0	10.0	100.0%	0		8.36s	861	0

Comparație rapidă

Schimbă perechea de comparație

DeepSeek V3.2mediumvsGPT-5.3 Chatnone Gemini 3.1 Flash Lite PreviewlowvsGPT-5.3 Chatnone GPT-5.3 ChatnonevsMiMo-V2-Flashmedium Claude Sonnet 4.6nonevsSeed-2.0-Minimedium Gemini 2.5 FlashmediumvsGPT-5.3 Chatnone GPT-5.3 ChatnonevsGLM 5medium GPT-5.3 ChatnonevsStep 3.5 FlashmediumDisponibil gratuit Seed-2.0-MinimediumvsGemini 3.1 Flash Lite Previewnone Gemini 3.1 Flash Lite PreviewmediumvsGPT-5.3 Chatnone Seed-2.0-MinimediumvsGemini 3 Flash Previewnone GPT-5.3 ChatnonevsQwen3.5-Flashmedium Seed-2.0-MinimediumvsGemini 3.1 Flash Lite Previewlow