Навигация
AI BENCHY
Your ad here

AI BENCHY Compare

MiniMax: MiniMax M2.5 vs NVIDIA: Nemotron 3 Super

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-04-26

Метрика MiniMax M2.5 MiniMax M2.5 medium Релиз: 2026-02-12 Бесплатно доступно Nemotron 3 Super Nemotron 3 Super none Релиз: 2026-03-11 Бесплатно доступно
Оценка 5.7 5.1
Ранг #83 #103
Надежность Н/Д Н/Д
Стабильность 5.6 8.2
Тестов верно
Доля успешных попыток 57.4% 35.2%
Нестабильные тесты 10 4
Всего запусков 54 52
Стоимость за результат 4.987 0.000
Общая стоимость $0.250 $0.000
???? ????? $0.150 / 1M $0.090 / 1M
???? ?????? $1.150 / 1M $0.450 / 1M
Выходные токены 107,044 4,760
Токены рассуждений 206,422 0
Время ответа (среднее) 39.65s 8.54s
Время ответа (макс.) 237.27s 24.97s
Время ответа (суммарно) 396.47s 153.69s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
MiniMax M2.5 7.9 6.3 83.3% 2 20.82s 286 45,344
Nemotron 3 Super 4.8 10.0 25.0% 0 7.43s 2,174 0
Программирование Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
MiniMax M2.5 3.0 10.0 0.0% 0 0ms 0 0
Nemotron 3 Super 3.3 1.6 33.3% 1 2.99s 535 0
Комбинированный Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
MiniMax M2.5 4.5 2.1 66.7% 1 60.39s 740 9,713
Nemotron 3 Super 3.0 10.0 0.0% 0 19.98s 124 0
Парсинг и извлечение данных Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
MiniMax M2.5 4.6 1.7 66.7% 2 7.48s 266 3,835
Nemotron 3 Super 10.0 10.0 100.0% 0 7.92s 249 0
Предметно-ориентированное Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
MiniMax M2.5 2.9 4.4 22.2% 2 237.27s 105,047 133,487
Nemotron 3 Super 3.6 7.2 22.2% 1 6.23s 26 0
Общий интеллект Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
MiniMax M2.5 3.8 2.5 33.3% 1 6.63s 25 1,686
Nemotron 3 Super 4.2 9.9 0.0% 0 24.97s 170 0
Следование инструкциям Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
MiniMax M2.5 8.1 6.8 83.3% 1 4.64s 252 1,873
Nemotron 3 Super 4.9 6.9 33.3% 1 1.50s 66 0
Решение головоломок Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
MiniMax M2.5 5.3 7.2 44.4% 1 11.54s 159 9,547
Nemotron 3 Super 5.7 10.0 33.3% 0 7.50s 1,135 0
Вызов инструментов Оценка Стабильность Доля успешных попыток Нестабильные тесты Тестов верно Время ответа (среднее) Выходные токены Токены рассуждений
MiniMax M2.5 10.0 10.0 100.0% 0 15.35s 269 937
Nemotron 3 Super 4.7 1.6 66.7% 1 16.00s 281 0

Быстрое сравнение

Сменить пару сравнения