AI BENCHY Compare

MiniMax: MiniMax M2.5 vs OpenAI: gpt-oss-120b

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-04-29

Метрика	MiniMax M2.5 MiniMax M2.5 medium Релиз: 2026-02-12 Бесплатно доступно	gpt-oss-120b gpt-oss-120b medium Релиз: 2025-08-05 Бесплатно доступно

Метрика	MiniMax M2.5 MiniMax M2.5 medium Релиз: 2026-02-12 Бесплатно доступно	gpt-oss-120b gpt-oss-120b medium Релиз: 2025-08-05 Бесплатно доступно
Оценка	5.7	5.8
Ранг	#94	#88
Надежность	Н/Д	Н/Д
Стабильность	5.6	7.2
Тестов верно
Доля успешных попыток	57.4%	51.9%
Нестабильные тесты	10	6
Всего запусков	54	54
Стоимость за результат	4.987	0.144
Общая стоимость	$0.250	$0.011
???? ?????	$0.150 / 1M	$0.000 / 1M
???? ??????	$1.150 / 1M	$0.000 / 1M
Выходные токены	107,044	13,493
Токены рассуждений	206,422	36,879
Время ответа (среднее)	39.65s	16.08s
Время ответа (макс.)	237.27s	50.92s
Время ответа (суммарно)	396.47s	176.88s

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
MiniMax M2.5	7.9	6.3	83.3%	2		20.82s	286	45,344
gpt-oss-120b	6.7	9.9	50.0%	0		10.21s	3,518	2,177

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
MiniMax M2.5	3.0	10.0	0.0%	0		0ms	0	0
gpt-oss-120b	4.3	1.1	66.7%	1		26.33s	228	2,549

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
MiniMax M2.5	4.5	2.1	66.7%	1		60.39s	740	9,713
gpt-oss-120b	10.0	10.0	100.0%	0		31.18s	694	5,072

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
MiniMax M2.5	4.6	1.7	66.7%	2		7.48s	266	3,835
gpt-oss-120b	6.4	5.9	66.7%	1		1.98s	241	1,114

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
MiniMax M2.5	2.9	4.4	22.2%	2		237.27s	105,047	133,487
gpt-oss-120b	2.9	4.4	22.2%	2		50.92s	6,784	20,606

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
MiniMax M2.5	3.8	2.5	33.3%	1		6.63s	25	1,686
gpt-oss-120b	4.3	10.0	0.0%	0		7.90s	107	387

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
MiniMax M2.5	8.1	6.8	83.3%	1		4.64s	252	1,873
gpt-oss-120b	9.9	10.0	100.0%	0		7.63s	126	1,799

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
MiniMax M2.5	5.3	7.2	44.4%	1		11.54s	159	9,547
gpt-oss-120b	3.2	4.7	22.2%	2		11.80s	1,508	2,092

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Выходные токены	Токены рассуждений
MiniMax M2.5	10.0	10.0	100.0%	0		15.35s	269	937
gpt-oss-120b	9.8	10.0	100.0%	0		6.91s	287	1,083

Быстрое сравнение

Сменить пару сравнения

Kimi K2.6nonevsgpt-oss-120bmediumБесплатно доступно gpt-oss-120bmediumБесплатно доступноvsQwen3.5-27Bnone MiniMax M2.5mediumБесплатно доступноvsQwen3.5-122B-A10Bnone gpt-oss-120bmediumБесплатно доступноvsQwen3.5 Plus 2026-04-20none gpt-oss-120bmediumБесплатно доступноvsMiMo-V2.5-Pronone gpt-oss-120bmediumБесплатно доступноvsQwen3.6 Flashnone MiniMax M2.5mediumБесплатно доступноvsQwen3.6 Flashnone MiniMax M2.5mediumБесплатно доступноvsMiMo-V2.5-Pronone MiniMax M2.5mediumБесплатно доступноvsQwen3.5 Plus 2026-04-20none MiniMax M2.5mediumБесплатно доступноvsGLM 4.7 Flashnone MiniMax M2.5mediumБесплатно доступноvsGLM 5.1none gpt-oss-120bmediumБесплатно доступноvsQwen3.5-122B-A10Bnone