AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs Owl Alpha

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-05-22

Metrică	Seed-2.0-Lite Seed-2.0-Lite none Lansare: 2026-02-14	Owl Alpha Owl Alpha none Lansare: 2026-04-30

Metrică	Seed-2.0-Lite Seed-2.0-Lite none Lansare: 2026-02-14	Owl Alpha Owl Alpha none Lansare: 2026-04-30
Scor	5.9	5.7
Rang	#99	#106
Fiabilitate	10.0	10.0
Consistență	7.9	9.2
Teste corecte
Rată de trecere pe încercare	50.0%	41.7%
Teste instabile	5	2
Rulări totale	60	60
Cost per rezultat	0.216	0.000
Cost total	$0.018	$0.000
Preț de intrare	$0.250 / 1M	$0.000 / 1M
Preț de ieșire	$2.000 / 1M	$0.000 / 1M
Tokenuri de ieșire	3,164	4,864
Tokenuri de raționament	0	0
Timp de răspuns (mediu)	2.44s	8.84s
Timp de răspuns (maxim)	6.70s	47.10s
Timp de răspuns (total)	48.71s	176.83s

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	3.0	5.9	16.7%	2		2.43s	709	0
Owl Alpha	3.4	7.9	16.7%	1		2.78s	57	0

Programare	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	6.8	9.9	50.0%	0		2.95s	404	0
Owl Alpha	7.0	9.9	50.0%	0		39.68s	3,629	0

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	3.0	10.0	0.0%	0		6.59s	498	0
Owl Alpha	3.0	10.0	0.0%	0		21.74s	315	0

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	10.0	10.0	100.0%	0		1.82s	246	0
Owl Alpha	10.0	10.0	100.0%	0		3.60s	246	0

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	3.6	7.2	22.2%	1		1.33s	17	0
Owl Alpha	5.3	10.0	33.3%	0		3.00s	27	0

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	10.0	10.0	100.0%	0		3.45s	294	0
Owl Alpha	4.3	10.0	0.0%	0		4.61s	80	0

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	10.0	10.0	100.0%	0		1.06s	73	0
Owl Alpha	6.4	10.0	50.0%	0		2.63s	63	0

Rezolvare de puzzle-uri	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	5.2	4.4	55.6%	2		2.46s	620	0
Owl Alpha	5.9	7.2	55.6%	1		4.43s	202	0

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	10.0	10.0	100.0%	0		3.94s	292	0
Owl Alpha	10.0	10.0	100.0%	0		22.78s	231	0

Cultură generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de ieșire	Tokenuri de raționament
Seed-2.0-Lite	3.0	10.0	0.0%	0		1.96s	11	0
Owl Alpha	3.0	10.0	0.0%	0		2.50s	14	0

Comparație rapidă

Schimbă perechea de comparație

CobuddymediumDisponibil gratuitvsOwl Alphanone Seed-2.0-LitenonevsOwl Alphamedium Seed-2.0-LitenonevsNemotron 3 SupermediumDisponibil gratuit CobuddymediumDisponibil gratuitvsSeed-2.0-Litenone gpt-oss-120bmediumDisponibil gratuitvsOwl Alphanone Nemotron 3 SupermediumDisponibil gratuitvsOwl Alphanone Seed-2.0-LitenonevsGPT-5 Nanomedium Seed-2.0-Litenonevsgpt-oss-120bmediumDisponibil gratuit MiniMax M2.5mediumDisponibil gratuitvsOwl Alphanone Mistral Small 4mediumvsOwl Alphanone GPT-5 NanomediumvsOwl Alphanone Seed-2.0-LitenonevsMercury 2medium