Навигация
AI BENCHY
Your ad here

AI BENCHY Compare

Nemotron 3 Super 120b A12b vs OpenAI: GPT-5.2 Chat

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-03-17

Метрика Nemotron 3 Super 120b A12b Nemotron 3 Super 120b A12b medium Релиз: 2026-03-11 Бесплатно доступно GPT-5.2 Chat GPT-5.2 Chat none Релиз: 2025-12-11
Ранг #37 #24
Оценка 6.9 7.8
Стабильность 8.6 8.6
Стоимость за результат 0.000 2.462
Общая стоимость $0.000 $0.271
Тестов верно
Доля успешных попыток 58.8% 74.5%
Нестабильные тесты 3 3
Всего запусков 49 51
Выходные токены 11,947 16,001
Токены рассуждений 29,768 0
Время ответа (среднее) 19.06s 6.72s
Время ответа (макс.) 87.80s 38.52s
Время ответа (суммарно) 305.04s 114.20s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Nemotron 3 Super 120b A12b 10.0 10.0 100.0% 0 10.08s 1,776 3,345
GPT-5.2 Chat 8.7 7.9 91.7% 1 3.40s 1,807 0
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Nemotron 3 Super 120b A12b 10.0 10.0 100.0% 0 87.80s 2,021 9,996
GPT-5.2 Chat 10.0 10.0 100.0% 0 9.12s 1,243 0
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Nemotron 3 Super 120b A12b 10.0 10.0 100.0% 0 18.16s 877 2,607
GPT-5.2 Chat 10.0 10.0 100.0% 0 3.05s 980 0
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Nemotron 3 Super 120b A12b 2.9 4.4 22.2% 2 16.19s 5,255 6,072
GPT-5.2 Chat 5.3 10.0 33.3% 0 17.78s 7,810 0
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Nemotron 3 Super 120b A12b 3.8 9.9 0.0% 0 27.86s 104 1,149
GPT-5.2 Chat 4.4 3.0 33.3% 1 3.20s 335 0
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Nemotron 3 Super 120b A12b 7.2 6.5 66.7% 1 7.72s 1,042 2,479
GPT-5.2 Chat 7.5 6.1 83.3% 1 5.46s 1,528 0
Puzzle Solving Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Nemotron 3 Super 120b A12b 3.5 9.8 0.0% 0 8.39s 602 2,151
GPT-5.2 Chat 7.7 10.0 66.7% 0 4.42s 1,743 0
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
Nemotron 3 Super 120b A12b 10.0 10.0 100.0% 0 39.75s 270 1,969
GPT-5.2 Chat 10.0 10.0 100.0% 0 4.68s 555 0

Быстрое сравнение

Сменить пару сравнения