AI BENCHY Compare

Trinity Large Preview vs MiniMax: MiniMax M2.7

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-03-18

Метрика	Trinity Large Preview Trinity Large Preview none Релиз: 2026-01-27 Бесплатно доступно	MiniMax M2.7 MiniMax M2.7 medium Релиз: 2026-03-18

Метрика	Trinity Large Preview Trinity Large Preview none Релиз: 2026-01-27 Бесплатно доступно	MiniMax M2.7 MiniMax M2.7 medium Релиз: 2026-03-18
Оценка	5.3	5.0
Ранг	#60	#64
Стабильность	9.6	5.3
Тестов верно
Доля успешных попыток	31.4%	49.0%
Нестабильные тесты	1	10
Всего запусков	51	51
Стоимость за результат	0.000	2.398
Общая стоимость	$0.000	$0.072
???? ?????	$0.000 / 1M	$0.300 / 1M
???? ??????	$0.000 / 1M	$1.200 / 1M
Выходные токены	1,843	4,517
Токены рассуждений	0	47,612
Время ответа (среднее)	3.04s	27.32s
Время ответа (макс.)	8.91s	117.04s
Время ответа (суммарно)	51.75s	437.10s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Trinity Large Preview	3.0	10.0	0.0%	0		3.02s	593	0
MiniMax M2.7	7.9	6.3	83.3%	2		40.32s	3,010	17,716

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Trinity Large Preview	3.0	10.0	0.0%	0		8.91s	294	0
MiniMax M2.7	4.7	1.6	66.7%	1		41.03s	369	4,480

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Trinity Large Preview	10.0	10.0	100.0%	0		3.26s	186	0
MiniMax M2.7	6.3	5.8	66.7%	1		21.95s	187	5,882

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Trinity Large Preview	5.3	10.0	33.3%	0		877ms	25	0
MiniMax M2.7	3.0	10.0	0.0%	0		19.00s	8	2,796

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Trinity Large Preview	4.4	9.9	0.0%	0		2.86s	124	0
MiniMax M2.7	3.9	2.5	33.3%	1		38.70s	92	5,204

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Trinity Large Preview	4.1	6.7	16.7%	1		1.09s	63	0
MiniMax M2.7	3.7	1.8	50.0%	2		12.64s	213	2,457

Puzzle Solving	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Trinity Large Preview	5.4	10.0	33.3%	0		3.30s	291	0
MiniMax M2.7	3.8	4.5	33.3%	2		25.62s	334	8,076

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
Trinity Large Preview	10.0	10.0	100.0%	0		6.67s	267	0
MiniMax M2.7	4.7	1.6	66.7%	1		12.05s	304	1,001

Быстрое сравнение

Сменить пару сравнения

MiniMax M2.7mediumvsQwen3 Coder Nextnone MiniMax M2.7mediumvsGPT-4o-mininone Mercury 2nonevsMiniMax M2.7medium MiniMax M2.7mediumvsGPT-5.4 Mininone MiniMax M2.7mediumvsNemotron 3 Super 120b A12bnoneБесплатно доступно MiniMax M2.7mediumvsQwen3.5-9Bnone MiniMax M2.7mediumvsMistral Small 4none Trinity Large PreviewnoneБесплатно доступноvsMistral Small 4medium MiniMax M2.7mediumvsKimi K2.5none MiniMax M2.7mediumvsGrok 4.20 Betanone Trinity Large PreviewnoneБесплатно доступноvsQwen3 Coder Nextmedium MiniMax M2.7mediumvsGLM 4.7 Flashnone