AI BENCHY Compare

Nemotron 3 Ultra 550b A55b vs Owl Alpha

Rezumat

Comparație benchmark Nemotron 3 Ultra 550b A55b vs Owl Alpha: Nemotron 3 Ultra 550b A55b conduce la scorul mediu cu 8.1 vs 5.8. Owl Alpha are costul de benchmark mai mic, $0.000 vs $0.177. Owl Alpha este mai rapid cu 9.88s vs 15.05s, cu rate de reușită de 69.8% vs 36.5%.

Model recomandat: Nemotron 3 Ultra 550b A55b - Are cel mai puternic scor din această comparație (8.1) și cel mai bun echilibru între cost și timp de răspuns dintre toate cele 2 modele.

Benchmark-urile au fost generate din suitele de teste AI BENCHY la: 2026-06-12

Metrică	Nemotron 3 Ultra 550b A55b Nemotron 3 Ultra 550b A55b medium Lansare: 2026-06-04 Disponibil gratuit	Owl Alpha Owl Alpha none Lansare: 2026-04-30

Metrică	Nemotron 3 Ultra 550b A55b Nemotron 3 Ultra 550b A55b medium Lansare: 2026-06-04 Disponibil gratuit	Owl Alpha Owl Alpha none Lansare: 2026-04-30
Scor	8.1	5.8
Rang	#29	#114
Fiabilitate	9.7	10.0
Consistență	8.8	9.6
Teste corecte
Rată de trecere pe încercare	69.8%	36.5%
Teste instabile	3	1
Rulări totale	63	63
Cost per rezultat	0.000	0.000
Cost total	$0.177	$0.000
Preț de intrare	$0.500 / 1M	$0.000 / 1M
Preț de ieșire	$2.500 / 1M	$0.000 / 1M
Total tokenuri de intrare	46,813	42,283
Tokenuri de ieșire	18,002	5,913
Tokenuri de raționament	53,091	0
Timp de răspuns (mediu)	15.05s	9.88s
Timp de răspuns (maxim)	43.93s	47.10s
Timp de răspuns (total)	316.09s	207.38s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#29 Nemotron 3 Ultra 550b A55b

medium

No showcase result has been generated for this model yet.

Cost: $0.000
Time: -
Tokens: 0 tok

#114 Owl Alpha

none

Provider returned error

Cost: $0.000
Time: 0.2s
Tokens: 0 tok

Top modele după scor

Scor vs cost total

Timp de răspuns (mediu)

Scor vs Timp de răspuns (mediu)

Total tokenuri de ieșire

Scor vs Total tokenuri de ieșire

Defalcare pe categorii

Trucuri anti-AI	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Nemotron 3 Ultra 550b A55b	10.0	10.0	100.0%	0		8.62s	780	835	1,485
Owl Alpha	3.4	7.9	16.7%	1		2.78s	1,104	57	0

Programare	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Nemotron 3 Ultra 550b A55b	8.4	7.4	88.9%	1		26.53s	7,686	2,854	17,725
Owl Alpha	5.6	10.0	33.3%	0		36.89s	8,055	4,740	0

Combinat	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Nemotron 3 Ultra 550b A55b	9.8	10.0	100.0%	0		43.93s	17,574	1,040	3,590
Owl Alpha	3.0	10.0	0.0%	0		21.74s	13,890	315	0

Parsare și extragere de date	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Nemotron 3 Ultra 550b A55b	10.0	10.0	100.0%	0		5.68s	7,989	473	1,285
Owl Alpha	10.0	10.0	100.0%	0		3.60s	7,911	246	0

Specific domeniului	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Nemotron 3 Ultra 550b A55b	3.5	4.4	33.3%	2		24.90s	858	11,169	16,249
Owl Alpha	5.3	10.0	33.3%	0		3.00s	1,171	27	0

Inteligență generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Nemotron 3 Ultra 550b A55b	3.7	9.5	0.0%	0		2.52s	360	70	235
Owl Alpha	4.3	10.0	0.0%	0		4.61s	609	80	0

Respectarea instrucțiunilor	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Nemotron 3 Ultra 550b A55b	9.8	10.0	100.0%	0		6.35s	765	182	1,243
Owl Alpha	6.4	10.0	50.0%	0		2.63s	915	63	0

Rezolvare de puzzle-uri	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Nemotron 3 Ultra 550b A55b	5.5	9.9	33.3%	0		3.54s	792	771	2,055
Owl Alpha	5.4	10.0	33.3%	0		4.18s	1,023	140	0

Apelare instrumente	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Nemotron 3 Ultra 550b A55b	10.0	10.0	100.0%	0		7.72s	9,781	304	984
Owl Alpha	10.0	10.0	100.0%	0		22.78s	7,155	231	0

Cultură generală	Scor	Consistență	Rată de trecere pe încercare	Teste instabile	Teste corecte	Timp de răspuns (mediu)	Tokenuri de intrare	Tokenuri de ieșire	Tokenuri de raționament
Nemotron 3 Ultra 550b A55b	3.0	10.0	0.0%	0		38.47s	228	304	8,240
Owl Alpha	3.0	10.0	0.0%	0		2.50s	450	14	0

Comparație rapidă

Schimbă perechea de comparație