AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs Google: Gemini 3.1 Pro Preview

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-04-26

Metrică	Seed-2.0-Lite Seed-2.0-Lite none Lansare: 2026-02-14	Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium Lansare: 2026-02-19

Metrică	Seed-2.0-Lite Seed-2.0-Lite none Lansare: 2026-02-14	Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium Lansare: 2026-02-19
Scor	6.2	9.6
Rang	#72	#2
Fiabilitate	N/D	N/D
Consistență	7.7	10.0
Teste corecte
Rată de trecere pe încercare	55.6%	94.4%
Teste instabile	5	0
Rulări totale	54	54
Cost per rezultat	0.200	3.400
Cost total	$0.016	$0.578
Preț de intrare	$0.250 / 1M	$2.000 / 1M
Preț de ieșire	$2.000 / 1M	$12.000 / 1M
Tokenuri de ieșire	3,129	1,932
Tokenuri de raționament	0	40,542
Timp de răspuns (mediu)	2.53s	15.96s
Timp de răspuns (maxim)	6.70s	40.61s
Timp de răspuns (total)	45.46s	175.52s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	3.0	5.9	16.7%	2		2.43s	709	0
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		7.90s	112	3,218

Programare	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	10.0	10.0	100.0%	0		4.61s	380	0
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		19.88s	405	4,201

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	3.0	10.0	0.0%	0		6.59s	498	0
Gemini 3.1 Pro Preview	9.5	10.0	100.0%	0		40.61s	432	9,281

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	10.0	10.0	100.0%	0		1.82s	246	0
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		7.72s	279	3,904

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	3.6	7.2	22.2%	1		1.33s	17	0
Gemini 3.1 Pro Preview	7.7	10.0	66.7%	0		32.73s	18	12,424

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	10.0	10.0	100.0%	0		3.45s	294	0
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		11.77s	108	1,179

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	10.0	10.0	100.0%	0		1.06s	73	0
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		9.56s	72	2,236

Rezolvare de puzzle-uri	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	5.2	4.4	55.6%	2		2.46s	620	0
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		7.15s	232	3,117

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	10.0	10.0	100.0%	0		3.94s	292	0
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		23.15s	274	982

Comparație rapidă

Schimbă perechea de comparație

Seed-2.0-LitenonevsGPT-5 Nanomedium Seed-2.0-Litenonevsgpt-oss-120bmediumDisponibil gratuit Seed-2.0-LitenonevsMercury 2medium Claude Opus 4.7nonevsGemini 3.1 Pro Previewmedium Seed-2.0-LitenonevsMiniMax M2.5mediumDisponibil gratuit Seed-2.0-LitenonevsGrok 4.1 Fastmedium Seed-2.0-LitenonevsMistral Small 4medium Gemini 3.1 Pro PreviewmediumvsGPT-5.5low Seed-2.0-LitenonevsNemotron 3 SupermediumDisponibil gratuit Seed-2.0-LitenonevsDeepSeek V4 Prohigh Seed-2.0-LitenonevsGrok 4.20medium Seed-2.0-LitenonevsKimi K2.5medium