Compară Grafice Metodologie

Limbă:

❤️ Made by XCS

AI BENCHY Compare

ByteDance Seed: Seed-2.0-Mini vs Google: Gemini 3.1 Flash Lite Preview

Compară:

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-03-06

Metrică	ByteDance Seed: Seed-2.0-Mini medium Lansare: 2026-02-14	Google: Gemini 3.1 Flash Lite Preview low Lansare: 2026-03-03
Scor mediu	7.0	7.6
Rang	#23	#12
Teste corecte
Consistență	9.4	10.0
Cost per rezultat	0.261	0.170
Cost total	$0.027	$0.019
Rată de trecere pe încercare	71.1%	73.3%
Teste instabile	1	0
common.totalRuns	45 (15 x 3)	45 (15 x 3)
Tokenuri de ieșire	1,752	1,542
Tokenuri de raționament	54,246	6,888
Timp de răspuns (mediu)	67.46s	3.49s
Timp de răspuns (maxim)	262.83s	11.91s
Timp de răspuns (total)	809.49s	52.29s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor mediu vs Timp de răspuns (mediu)

Defalcare pe categorii

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
ByteDance Seed: Seed-2.0-Mini	7.0	10.0	66.7%	0		98.99s	354	9,352
Google: Gemini 3.1 Flash Lite Preview	7.0	10.0	66.7%	0		2.18s	456	1,224

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
ByteDance Seed: Seed-2.0-Mini	10.0	10.0	100.0%	0		262.83s	404	29,806
Google: Gemini 3.1 Flash Lite Preview	10.0	10.0	0.0%	0		11.91s	225	762

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
ByteDance Seed: Seed-2.0-Mini	9.9	10.0	100.0%	0		24.27s	246	2,743
Google: Gemini 3.1 Flash Lite Preview	9.9	10.0	100.0%	0		3.00s	291	696

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
ByteDance Seed: Seed-2.0-Mini	10.0	10.0	0.0%	0		0ms	0	0
Google: Gemini 3.1 Flash Lite Preview	4.0	10.0	33.3%	0		2.36s	18	1,212

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
ByteDance Seed: Seed-2.0-Mini	10.0	10.0	100.0%	0		17.47s	69	2,050
Google: Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		1.49s	72	753

Puzzle Solving	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
ByteDance Seed: Seed-2.0-Mini	7.0	7.2	88.9%	1		25.85s	457	5,060
Google: Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		2.76s	243	1,248

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
ByteDance Seed: Seed-2.0-Mini	10.0	10.0	100.0%	0		88.68s	222	5,235
Google: Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		9.54s	237	993

Comparație rapidă

Schimbă perechea de comparație

DeepSeek V3.2mediumvsGemini 3.1 Flash Lite Previewlow Seed-2.0-MinimediumvsGemini 3 Flash Previewnone Claude Sonnet 4.6mediumvsGemini 3.1 Flash Lite Previewlow Claude Sonnet 4.6nonevsSeed-2.0-Minimedium Gemini 3.1 Flash Lite PreviewlowvsStep 3.5 FlashmediumDisponibil gratuit Gemini 3.1 Flash Lite PreviewlowvsMiMo-V2-Flashmedium Gemini 3.1 Flash Lite PreviewlowvsGLM 5medium Gemini 3.1 Flash Lite PreviewlowvsGPT-5.3 Chatnone Gemini 3.1 Flash Lite PreviewlowvsGPT-5.2 Chatnone Seed-2.0-MinimediumvsGemini 3.1 Flash Lite Previewnone Seed-2.0-MinimediumvsGPT-5.3 Chatnone Seed-2.0-MinimediumvsQwen3.5 Plus 2026-02-15none