AI BENCHY Compare

Nemotron 3 Ultra 550b A55b vs Grok 4.20 Beta

Сводка

Сравнение benchmark Nemotron 3 Ultra 550b A55b vs Grok 4.20 Beta: Grok 4.20 Beta лидирует по среднему баллу: 8.5 vs 7.5. Nemotron 3 Ultra 550b A55b имеет более низкую стоимость benchmark: $0.177 vs $0.750. Grok 4.20 Beta быстрее: 9.75s vs 15.05s, с долей успешных попыток 69.8% vs 81.5%.

Рекомендуемая модель: Nemotron 3 Ultra 550b A55b - Он дает лучший общий компромисс: конкурентный балл (7.5), ниже стоимость, чем у Grok 4.20 Beta, и сбалансированное время ответа.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-10

Метрика	Nemotron 3 Ultra 550b A55b Nemotron 3 Ultra 550b A55b medium Релиз: 2026-06-04 Бесплатно доступно	Grok 4.20 Beta Grok 4.20 Beta medium Релиз: 2026-03-12

Метрика	Nemotron 3 Ultra 550b A55b Nemotron 3 Ultra 550b A55b medium Релиз: 2026-06-04 Бесплатно доступно	Grok 4.20 Beta Grok 4.20 Beta medium Релиз: 2026-03-12
Оценка	7.5	8.5
Ранг	#42	#14
Надежность	9.7	Н/Д
Стабильность	8.8	9.5
Тестов верно
Доля успешных попыток	69.8%	81.5%
Нестабильные тесты	3	1
Всего запусков	63	52
Стоимость за результат	0.000	4.505
Общая стоимость	$0.177	$0.750
Цена входа	$0.500 / 1M	$5.805 / 1M
Цена выхода	$2.500 / 1M	$5.805 / 1M
Общее число входных токенов	46,813	35,955
Выходные токены	18,002	1,647
Токены рассуждений	53,091	91,565
Время ответа (среднее)	15.05s	9.75s
Время ответа (макс.)	43.93s	31.36s
Время ответа (суммарно)	316.09s	175.48s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#42 Nemotron 3 Ultra 550b A55b

medium

No showcase result has been generated for this model yet.

Cost: $0.000
Time: -
Tokens: 0 tok

#14 Grok 4.20 Beta

medium

Cost: $0.034
Time: 91.0s
Tokens: 13,523 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Nemotron 3 Ultra 550b A55b	10.0	10.0	100.0%	0		8.62s	780	835	1,485
Grok 4.20 Beta	8.7	7.9	91.7%	1		3.16s	2,010	268	7,583

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Nemotron 3 Ultra 550b A55b	8.4	7.4	88.9%	1		26.53s	7,686	2,854	17,725
Grok 4.20 Beta	10.0	10.0	100.0%	0		31.36s	360	81	3,987

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Nemotron 3 Ultra 550b A55b	9.8	10.0	100.0%	0		43.93s	17,574	1,040	3,590
Grok 4.20 Beta	10.0	10.0	100.0%	0		20.93s	12,909	227	12,212

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Nemotron 3 Ultra 550b A55b	10.0	10.0	100.0%	0		5.68s	7,989	473	1,285
Grok 4.20 Beta	10.0	10.0	100.0%	0		4.01s	7,761	180	5,281

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Nemotron 3 Ultra 550b A55b	3.5	4.4	33.3%	2		24.90s	858	11,169	16,249
Grok 4.20 Beta	5.3	10.0	33.3%	0		21.33s	1,764	251	40,255

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Nemotron 3 Ultra 550b A55b	3.7	9.5	0.0%	0		2.52s	360	70	235
Grok 4.20 Beta	10.0	10.0	100.0%	0		5.78s	825	72	3,440

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Nemotron 3 Ultra 550b A55b	9.8	10.0	100.0%	0		6.35s	765	182	1,243
Grok 4.20 Beta	9.8	10.0	100.0%	0		4.89s	1,362	57	7,123

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Nemotron 3 Ultra 550b A55b	5.5	9.9	33.3%	0		3.54s	792	771	2,055
Grok 4.20 Beta	10.0	10.0	100.0%	0		3.52s	1,689	328	6,300

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Nemotron 3 Ultra 550b A55b	10.0	10.0	100.0%	0		7.72s	9,781	304	984
Grok 4.20 Beta	3.0	10.0	0.0%	0		12.39s	7,275	183	5,384

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
Nemotron 3 Ultra 550b A55b	3.0	10.0	0.0%	0		38.47s	228	304	8,240
Grok 4.20 Beta	-	-	-	-	-	-	-	-	-

Быстрое сравнение

Сменить пару сравнения