Навигация
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

NVIDIA: Nemotron 3 Super vs OpenAI: GPT-5.4

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-05-10

Метрика Nemotron 3 Super Nemotron 3 Super medium Релиз: 2026-03-11 Бесплатно доступно GPT-5.4 GPT-5.4 none Релиз: 2026-03-05
Оценка 6.1 5.7
Ранг #87 #100
Надежность 10.0 10.0
Стабильность 8.8 9.1
Тестов верно
Доля успешных попыток 47.4% 40.4%
Нестабильные тесты 3 2
Всего запусков 57 57
Стоимость за результат 0.004 1.493
Общая стоимость $0.001 $0.105
???? ????? $0.090 / 1M $2.500 / 1M
???? ?????? $0.450 / 1M $15.000 / 1M
Выходные токены 14,098 2,357
Токены рассуждений 29,580 0
Время ответа (среднее) 18.72s 1.48s
Время ответа (макс.) 87.80s 2.95s
Время ответа (суммарно) 318.29s 28.20s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Nemotron 3 Super 8.3 10.0 75.0% 0 7.85s 748 1,305
GPT-5.4 3.2 8.0 8.3% 1 1.21s 406 0
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Nemotron 3 Super 3.0 10.0 0.0% 0 0ms 0 0
GPT-5.4 10.0 10.0 100.0% 0 2.95s 480 0
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Nemotron 3 Super 10.0 10.0 100.0% 0 87.80s 2,021 9,996
GPT-5.4 3.0 10.0 0.0% 0 2.89s 291 0
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Nemotron 3 Super 10.0 10.0 100.0% 0 18.16s 877 2,607
GPT-5.4 10.0 10.0 100.0% 0 1.04s 222 0
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Nemotron 3 Super 2.9 4.4 22.2% 2 16.19s 5,255 6,072
GPT-5.4 5.3 7.2 44.4% 1 1.07s 50 0
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Nemotron 3 Super 4.1 10.0 0.0% 0 6.91s 105 363
GPT-5.4 4.4 9.9 0.0% 0 1.78s 184 0
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Nemotron 3 Super 7.2 6.6 66.7% 1 7.72s 1,042 2,479
GPT-5.4 6.5 10.0 50.0% 0 1.07s 81 0
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Nemotron 3 Super 3.1 10.0 0.0% 0 4.32s 529 1,476
GPT-5.4 5.6 9.8 33.3% 0 1.52s 357 0
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Nemotron 3 Super 10.0 10.0 100.0% 0 39.75s 270 1,969
GPT-5.4 10.0 10.0 100.0% 0 2.75s 246 0
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Nemotron 3 Super 3.0 10.0 0.0% 0 55.32s 3,251 3,313
GPT-5.4 3.0 10.0 0.0% 0 990ms 40 0

Быстрое сравнение

Сменить пару сравнения