AI BENCHY Compare

MiniMax: MiniMax M2.7 vs OpenAI: gpt-oss-120b

Сводка

Сравнение benchmark MiniMax M2.7 (medium) vs gpt-oss-120b: MiniMax M2.7 (medium) лидирует по среднему баллу: 5.2 vs 4.0. gpt-oss-120b имеет более низкую стоимость benchmark: $0.010 vs $0.100. gpt-oss-120b быстрее: 21.61s vs 38.18s, с долей успешных попыток 46.0% vs 34.9%.

Рекомендуемая модель: MiniMax M2.7 (medium) - У него самый высокий балл в этом сравнении (5.2) и лучший общий баланс стоимости и времени ответа среди всех 2 моделей.

Бенчмарки сгенерированы из тестовых наборов AI BENCHY в: 2026-07-09

Метрика	MiniMax M2.7 MiniMax M2.7 medium Релиз: 2026-03-18	gpt-oss-120b gpt-oss-120b none Релиз: 2025-08-05 Бесплатно доступно

Метрика	MiniMax M2.7 MiniMax M2.7 medium Релиз: 2026-03-18	gpt-oss-120b gpt-oss-120b none Релиз: 2025-08-05 Бесплатно доступно
Оценка	5.2	4.0
Ранг	#146	#183
Надежность	10.0	10.0
Стабильность	6.8	8.2
Тестов верно
Доля успешных попыток	46.0%	34.9%
Нестабильные тесты	8	2
Всего запусков	63	57
Стоимость за результат	2.494	0.168
Общая стоимость	$0.100	$0.010
Цена входа	$0.240 / 1M	$0.036 / 1M
Цена выхода	$0.960 / 1M	$0.180 / 1M
Общее число входных токенов	34,371	9,081
Выходные токены	8,981	51,664
Токены рассуждений	89,812	0
Время ответа (среднее)	38.18s	21.61s
Время ответа (макс.)	196.21s	113.71s
Время ответа (суммарно)	763.60s	345.79s

Генерация showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#146 MiniMax M2.7

medium

Стоимость: $0.022
Время: 22.8s
Токены: 9,250 tok

#183 gpt-oss-120b

none

Для этой модели еще не сгенерирован результат showcase.

Стоимость: $0.000
Время: -
Токены: 0 tok

Лучшие модели по оценке

Оценка vs общая стоимость

Время ответа (среднее)

Оценка vs Время ответа (среднее)

Общее число выходных токенов

Оценка vs Общее число выходных токенов

Разбивка по категориям

Анти-ИИ уловки	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
MiniMax M2.7	7.9	6.3	83.3%	2		40.32s	654	3,010	17,716
gpt-oss-120b	6.5	10.0	50.0%	0		32.84s	1,336	8,676	0

Программирование	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
MiniMax M2.7	5.7	9.1	33.3%	0		101.89s	2,961	1,231	38,841
gpt-oss-120b	1.5	4.0	22.2%	1		9.57s	901	3,232	0

Комбинированный	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
MiniMax M2.7	4.7	1.6	66.7%	1		41.03s	14,233	369	4,480
gpt-oss-120b	3.0	10.0	0.0%	0		0ms	0	0	0

Парсинг и извлечение данных	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
MiniMax M2.7	6.3	5.8	66.7%	1		21.95s	7,152	187	5,882
gpt-oss-120b	6.5	10.0	50.0%	0		7.12s	2,421	598	0

Предметно-ориентированное	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
MiniMax M2.7	3.0	10.0	0.0%	0		19.00s	245	8	2,796
gpt-oss-120b	3.0	10.0	0.0%	0		34.98s	1,294	29,483	0

Общий интеллект	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
MiniMax M2.7	3.9	2.5	33.3%	1		38.70s	486	92	5,204
gpt-oss-120b	4.8	10.0	0.0%	0		10.79s	584	615	0

Следование инструкциям	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
MiniMax M2.7	3.8	5.8	33.3%	1		12.80s	687	350	2,600
gpt-oss-120b	9.8	10.0	100.0%	0		5.06s	1,043	1,940	0

Решение головоломок	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
MiniMax M2.7	5.9	7.2	55.6%	1		24.87s	675	362	7,840
gpt-oss-120b	6.0	7.2	55.6%	1		8.21s	1,188	3,982	0

Вызов инструментов	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
MiniMax M2.7	4.7	1.6	66.7%	1		12.05s	7,067	304	1,001
gpt-oss-120b	3.0	10.0	0.0%	0		0ms	0	0	0

Эрудиция	Оценка	Стабильность	Доля успешных попыток	Нестабильные тесты	Тестов верно	Время ответа (среднее)	Входные токены	Выходные токены	Токены рассуждений
MiniMax M2.7	3.0	10.0	0.0%	0		22.77s	211	3,068	3,452
gpt-oss-120b	3.0	10.0	0.0%	0		47.29s	314	3,138	0

Быстрое сравнение

Сменить пару сравнения