Навигация
AI BENCHY
Your ad here

AI BENCHY Compare

Nemotron 3 Super 120b A12b vs OpenAI: GPT-5.4 Mini

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-03-17

Метрика Nemotron 3 Super 120b A12b Nemotron 3 Super 120b A12b medium Релиз: 2026-03-11 Бесплатно доступно GPT-5.4 Mini GPT-5.4 Mini none Релиз: 2026-03-17
Ранг #37 #66
Оценка 6.9 4.8
Стабильность 8.6 8.6
Стоимость за результат 0.000 0.737
Общая стоимость $0.000 $0.030
Тестов верно
Доля успешных попыток 58.8% 31.4%
Нестабильные тесты 3 3
Всего запусков 49 51
Выходные токены 11,947 2,085
Токены рассуждений 29,768 0
Время ответа (среднее) 19.06s 1.17s
Время ответа (макс.) 87.80s 2.52s
Время ответа (суммарно) 305.04s 19.82s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Nemotron 3 Super 120b A12b 10.0 10.0 100.0% 0 10.08s 1,776 3,345
GPT-5.4 Mini 3.1 8.1 8.3% 1 929ms 654 0
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Nemotron 3 Super 120b A12b 10.0 10.0 100.0% 0 87.80s 2,021 9,996
GPT-5.4 Mini 3.0 10.0 0.0% 0 2.52s 298 0
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Nemotron 3 Super 120b A12b 10.0 10.0 100.0% 0 18.16s 877 2,607
GPT-5.4 Mini 10.0 10.0 100.0% 0 1.30s 222 0
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Nemotron 3 Super 120b A12b 2.9 4.4 22.2% 2 16.19s 5,255 6,072
GPT-5.4 Mini 3.5 4.4 33.3% 2 937ms 88 0
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Nemotron 3 Super 120b A12b 3.8 9.9 0.0% 0 27.86s 104 1,149
GPT-5.4 Mini 4.8 10.0 0.0% 0 1.82s 174 0
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Nemotron 3 Super 120b A12b 7.2 6.5 66.7% 1 7.72s 1,042 2,479
GPT-5.4 Mini 6.3 10.0 50.0% 0 728ms 101 0
Puzzle Solving Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Nemotron 3 Super 120b A12b 3.5 9.8 0.0% 0 8.39s 602 2,151
GPT-5.4 Mini 5.4 10.0 33.3% 0 860ms 293 0
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Nemotron 3 Super 120b A12b 10.0 10.0 100.0% 0 39.75s 270 1,969
GPT-5.4 Mini 3.0 10.0 0.0% 0 2.32s 255 0

Быстрое сравнение

Сменить пару сравнения