AI BENCHY Compare

MiniMax: MiniMax M2.7 vs OpenAI: gpt-oss-120b

Last updated at: 2026-04-11

Metric	MiniMax M2.7 MiniMax M2.7 medium Release: 2026-03-18	gpt-oss-120b gpt-oss-120b none Release: 2025-08-05 Free Available

Metric	MiniMax M2.7 MiniMax M2.7 medium Release: 2026-03-18	gpt-oss-120b gpt-oss-120b none Release: 2025-08-05 Free Available
Score	5.3	5.2
Rank	#76	#79
Consistency	5.5	7.9
Tests Correct
Attempt pass rate	51.9%	38.9%
Flaky tests	10	5
Total Runs	54	54
Cost per result	2.273	0.221
Total Cost	$0.091	$0.009
Input Price	$0.300 / 1M	$0.039 / 1M
Output Price	$1.200 / 1M	$0.190 / 1M
Output Tokens	4,984	44,652
Reasoning Tokens	62,787	0
Response Time (avg)	31.08s	11.96s
Response Time (max)	117.04s	68.97s
Response Time (total)	528.37s	179.34s

Top Models by Score

Score vs Total Cost

Response Time (avg)

Score vs Response Time (avg)

Total Output Tokens

Score vs Total Output Tokens

Category Breakdown

Anti-AI Tricks	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
MiniMax M2.7	7.9	6.3	83.3%	2		40.32s	3,010	17,716
gpt-oss-120b	6.6	8.0	58.3%	1		6.03s	4,867	0

Coding	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
MiniMax M2.7	10.0	10.0	100.0%	0		91.27s	467	15,175
gpt-oss-120b	4.3	1.1	66.7%	1		9.57s	3,232	0

Combined	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
MiniMax M2.7	4.7	1.6	66.7%	1		41.03s	369	4,480
gpt-oss-120b	3.0	10.0	0.0%	0		0ms	0	0

Data parsing and extraction	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
MiniMax M2.7	6.3	5.8	66.7%	1		21.95s	187	5,882
gpt-oss-120b	6.5	10.0	50.0%	0		7.12s	598	0

Domain specific	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
MiniMax M2.7	3.0	10.0	0.0%	0		19.00s	8	2,796
gpt-oss-120b	3.0	10.0	0.0%	0		34.98s	29,483	0

General Intelligence	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
MiniMax M2.7	3.9	2.5	33.3%	1		38.70s	92	5,204
gpt-oss-120b	4.6	10.0	0.0%	0		2.83s	586	0

Instructions following	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
MiniMax M2.7	3.7	1.8	50.0%	2		12.64s	213	2,457
gpt-oss-120b	8.4	6.9	83.3%	1		5.10s	1,982	0

Puzzle Solving	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
MiniMax M2.7	3.8	4.5	33.3%	2		25.62s	334	8,076
gpt-oss-120b	4.5	4.8	44.5%	2		6.86s	3,904	0

Tool Calling	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
MiniMax M2.7	4.7	1.6	66.7%	1		12.05s	304	1,001
gpt-oss-120b	3.0	10.0	0.0%	0		0ms	0	0

Quick Compare

Switch Comparison Pair

MiniMax M2.7mediumvsGrok 4.20none MiniMax M2.7mediumvsMistral Small 4none Trinity Large PreviewnoneFree AvailablevsMiniMax M2.7medium MiniMax M2.7mediumvsGPT-5.4 Mininone MiniMax M2.7mediumvsQwen3 Coder Nextnone MiniMax M2.7mediumvsNemotron 3 SupernoneFree Available MiniMax M2.7mediumvsGLM 5 Turbonone MiniMax M2.7mediumvsKimi K2.5none MiniMax M2.7mediumvsGLM 5.1none MiniMax M2.7mediumvsGLM 4.7 Flashnone MiniMax M2.7mediumvsGPT-4o-mininone MiniMax M2.7mediumvsQwen3.5-122B-A10Bnone