AI BENCHY Compare

Nemotron 3 Ultra 550b A55b vs Grok 4.20 Multi Agent Beta

Muhtasari

Ulinganisho wa benchmark Nemotron 3 Ultra 550b A55b vs Grok 4.20 Multi Agent Beta: Nemotron 3 Ultra 550b A55b inaongoza kwa average score: 7.5 vs 6.6. Nemotron 3 Ultra 550b A55b ina gharama ya chini ya benchmark: $0.177 vs $5.599. Grok 4.20 Multi Agent Beta ni ya haraka zaidi: 9.69s vs 15.05s, na pass rates 69.8% vs 59.3%.

Muundo unaopendekezwa: Nemotron 3 Ultra 550b A55b - It has the best score here (7.5), while costing about 31.8x less than Grok 4.20 Multi Agent Beta.

Benchmark zimetengenezwa kutoka seti za majaribio za AI BENCHY tarehe: 2026-06-10

Kipimo	Nemotron 3 Ultra 550b A55b Nemotron 3 Ultra 550b A55b medium Toleo: 2026-06-04 Inapatikana bure	Grok 4.20 Multi Agent Beta Grok 4.20 Multi Agent Beta medium Toleo: 2026-03-12

Kipimo	Nemotron 3 Ultra 550b A55b Nemotron 3 Ultra 550b A55b medium Toleo: 2026-06-04 Inapatikana bure	Grok 4.20 Multi Agent Beta Grok 4.20 Multi Agent Beta medium Toleo: 2026-03-12
Alama	7.5	6.6
Nafasi	#42	#85
Uaminifu	9.7	Haipo
Uthabiti	8.8	7.9
Majaribio sahihi
Kiwango cha kupita kwa kila jaribio	69.8%	59.3%
Majaribio yasiyo thabiti	3	5
Jumla ya uendeshaji	63	52
Gharama kwa matokeo	0.000	62.923
Jumla ya gharama	$0.177	$5.599
Bei ya ingizo	$0.500 / 1M	$4.235 / 1M
Bei ya toleo	$2.500 / 1M	$4.235 / 1M
Jumla ya tokeni za ingizo	46,813	721,952
Tokeni za matokeo	18,002	294,668
Tokeni za hoja	53,091	305,374
Muda wa majibu (wastani)	15.05s	9.69s
Muda wa majibu (upeo)	43.93s	35.28s
Muda wa majibu (jumla)	316.09s	155.07s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#42 Nemotron 3 Ultra 550b A55b

medium

No showcase result has been generated for this model yet.

Cost: $0.000
Time: -
Tokens: 0 tok

#85 Grok 4.20 Multi Agent Beta

medium

Cost: $0.261
Time: 123.4s
Tokens: 199,344 tok

Modeli bora kwa alama

Alama dhidi ya gharama ya jumla

Muda wa majibu (wastani)

Alama vs Muda wa majibu (wastani)

Jumla ya tokeni za matokeo

Alama vs Jumla ya tokeni za matokeo

Mgawanyo wa kategoria

Mbinu za kupinga AI	Alama	Uthabiti	Kiwango cha kupita kwa kila jaribio	Majaribio yasiyo thabiti	Majaribio sahihi	Muda wa majibu (wastani)	Tokeni za ingizo	Tokeni za matokeo	Tokeni za hoja
Nemotron 3 Ultra 550b A55b	10.0	10.0	100.0%	0		8.62s	780	835	1,485
Grok 4.20 Multi Agent Beta	6.9	5.8	75.0%	2		3.46s	90,925	33,706	33,077

Uandishi wa msimbo	Alama	Uthabiti	Kiwango cha kupita kwa kila jaribio	Majaribio yasiyo thabiti	Majaribio sahihi	Muda wa majibu (wastani)	Tokeni za ingizo	Tokeni za matokeo	Tokeni za hoja
Nemotron 3 Ultra 550b A55b	8.4	7.4	88.9%	1		26.53s	7,686	2,854	17,725
Grok 4.20 Multi Agent Beta	10.0	10.0	100.0%	0		27.11s	13,212	86	13,141

Mchanganyiko	Alama	Uthabiti	Kiwango cha kupita kwa kila jaribio	Majaribio yasiyo thabiti	Majaribio sahihi	Muda wa majibu (wastani)	Tokeni za ingizo	Tokeni za matokeo	Tokeni za hoja
Nemotron 3 Ultra 550b A55b	9.8	10.0	100.0%	0		43.93s	17,574	1,040	3,590
Grok 4.20 Multi Agent Beta	3.0	10.0	0.0%	0		0ms	0	0	0

Uchanganuzi na uchimbaji wa data	Alama	Uthabiti	Kiwango cha kupita kwa kila jaribio	Majaribio yasiyo thabiti	Majaribio sahihi	Muda wa majibu (wastani)	Tokeni za ingizo	Tokeni za matokeo	Tokeni za hoja
Nemotron 3 Ultra 550b A55b	10.0	10.0	100.0%	0		5.68s	7,989	473	1,285
Grok 4.20 Multi Agent Beta	10.0	10.0	100.0%	0		5.54s	97,232	25,306	25,051

Mahususi kwa domeni	Alama	Uthabiti	Kiwango cha kupita kwa kila jaribio	Majaribio yasiyo thabiti	Majaribio sahihi	Muda wa majibu (wastani)	Tokeni za ingizo	Tokeni za matokeo	Tokeni za hoja
Nemotron 3 Ultra 550b A55b	3.5	4.4	33.3%	2		24.90s	858	11,169	16,249
Grok 4.20 Multi Agent Beta	2.9	7.2	11.1%	1		24.67s	328,253	164,609	163,647

Akili ya jumla	Alama	Uthabiti	Kiwango cha kupita kwa kila jaribio	Majaribio yasiyo thabiti	Majaribio sahihi	Muda wa majibu (wastani)	Tokeni za ingizo	Tokeni za matokeo	Tokeni za hoja
Nemotron 3 Ultra 550b A55b	3.7	9.5	0.0%	0		2.52s	360	70	235
Grok 4.20 Multi Agent Beta	5.8	2.8	66.7%	1		6.40s	41,387	15,848	15,746

Ufuataji wa maagizo	Alama	Uthabiti	Kiwango cha kupita kwa kila jaribio	Majaribio yasiyo thabiti	Majaribio sahihi	Muda wa majibu (wastani)	Tokeni za ingizo	Tokeni za matokeo	Tokeni za hoja
Nemotron 3 Ultra 550b A55b	9.8	10.0	100.0%	0		6.35s	765	182	1,243
Grok 4.20 Multi Agent Beta	9.8	10.0	100.0%	0		3.52s	43,923	19,752	19,617

Utatuzi wa mafumbo	Alama	Uthabiti	Kiwango cha kupita kwa kila jaribio	Majaribio yasiyo thabiti	Majaribio sahihi	Muda wa majibu (wastani)	Tokeni za ingizo	Tokeni za matokeo	Tokeni za hoja
Nemotron 3 Ultra 550b A55b	5.5	9.9	33.3%	0		3.54s	792	771	2,055
Grok 4.20 Multi Agent Beta	6.7	7.9	55.6%	1		5.19s	107,020	35,361	35,095

Mwito wa zana	Alama	Uthabiti	Kiwango cha kupita kwa kila jaribio	Majaribio yasiyo thabiti	Majaribio sahihi	Muda wa majibu (wastani)	Tokeni za ingizo	Tokeni za matokeo	Tokeni za hoja
Nemotron 3 Ultra 550b A55b	10.0	10.0	100.0%	0		7.72s	9,781	304	984
Grok 4.20 Multi Agent Beta	3.0	10.0	0.0%	0		0ms	0	0	0

Maarifa ya jumla	Alama	Uthabiti	Kiwango cha kupita kwa kila jaribio	Majaribio yasiyo thabiti	Majaribio sahihi	Muda wa majibu (wastani)	Tokeni za ingizo	Tokeni za matokeo	Tokeni za hoja
Nemotron 3 Ultra 550b A55b	3.0	10.0	0.0%	0		38.47s	228	304	8,240
Grok 4.20 Multi Agent Beta	-	-	-	-	-	-	-	-	-

Ulinganisho wa haraka

Badilisha jozi ya ulinganisho