Навигация
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Inception: Mercury 2 vs NVIDIA: Nemotron 3 Super

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-06-03

Метрика Mercury 2 Mercury 2 none Релиз: 2026-02-24 Nemotron 3 Super Nemotron 3 Super medium Релиз: 2026-03-11 Бесплатно доступно
Оценка 4.6 5.9
Ранг #153 #102
Надежность 10.0 10.0
Стабильность 9.1 9.2
Тестов верно
Доля успешных попыток 25.0% 43.3%
Нестабильные тесты 2 2
Всего запусков 60 60
Стоимость за результат 0.216 0.004
Общая стоимость $0.009 $0.019
Цена входа $0.250 / 1M $0.090 / 1M
Цена выхода $0.750 / 1M $0.450 / 1M
Общее число входных токенов 25,515 36,614
Выходные токены 3,001 14,505
Токены рассуждений 0 30,178
Время ответа (среднее) 614ms 20.87s
Время ответа (макс.) 1.27s 87.80s
Время ответа (суммарно) 12.28s 375.66s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Mercury 2 3.0 10.0 0.0% 0 483ms 631 286 0
Nemotron 3 Super 8.3 10.0 75.0% 0 7.85s 686 748 1,305
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Mercury 2 3.5 9.4 0.0% 0 831ms 4,631 1,650 0
Nemotron 3 Super 3.1 9.9 0.0% 0 62.38s 1,362 452 848
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Mercury 2 3.0 10.0 0.0% 0 606ms 4,821 131 0
Nemotron 3 Super 10.0 10.0 100.0% 0 87.80s 15,561 2,021 9,996
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Mercury 2 7.3 5.9 83.3% 1 667ms 6,362 180 0
Nemotron 3 Super 10.0 10.0 100.0% 0 18.16s 7,944 877 2,607
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Mercury 2 5.3 7.2 44.4% 1 534ms 784 46 0
Nemotron 3 Super 2.9 4.4 22.2% 2 16.19s 456 5,255 6,072
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Mercury 2 4.8 10.0 0.0% 0 628ms 495 159 0
Nemotron 3 Super 4.1 10.0 0.0% 0 6.91s 492 105 363
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Mercury 2 6.5 10.0 50.0% 0 551ms 691 82 0
Nemotron 3 Super 7.3 10.0 50.0% 0 6.97s 723 956 2,383
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Mercury 2 3.1 10.0 0.0% 0 535ms 694 251 0
Nemotron 3 Super 3.0 10.0 0.0% 0 3.15s 708 570 1,322
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Mercury 2 10.0 10.0 100.0% 0 1.27s 6,193 197 0
Nemotron 3 Super 10.0 10.0 100.0% 0 39.75s 8,544 270 1,969
Эрудиция Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Входные токены Выходные токены Токены рассуждений
Mercury 2 3.0 10.0 0.0% 0 548ms 213 19 0
Nemotron 3 Super 3.0 10.0 0.0% 0 55.32s 138 3,251 3,313

Быстрое сравнение

Сменить пару сравнения