AI BENCHY Compare

MiniMax: MiniMax M2.5 vs Qwen3.6 Plus Preview

Last updated at: 2026-04-04

Metric	MiniMax M2.5 MiniMax M2.5 medium Release: 2026-02-12 Free Available	Qwen3.6 Plus Preview Qwen3.6 Plus Preview medium Release: 2026-03-30

Metric	MiniMax M2.5 MiniMax M2.5 medium Release: 2026-02-12 Free Available	Qwen3.6 Plus Preview Qwen3.6 Plus Preview medium Release: 2026-03-30
Score	5.9	8.5
Rank	#62	#7
Consistency	5.4	10.0
Tests Correct
Attempt pass rate	60.8%	76.5%
Flaky tests	10	0
Total Runs	51	49
Cost per result	4.987	0.000
Total Cost	$0.250	$0.000
Input Price	$0.118 / 1M	$0.000 / 1M
Output Price	$0.991 / 1M	$0.000 / 1M
Output Tokens	107,044	1,756
Reasoning Tokens	206,422	77,213
Response Time (avg)	39.65s	13.94s
Response Time (max)	237.27s	43.55s
Response Time (total)	396.47s	237.01s

Top Models by Score

Score vs Total Cost

Response Time (avg)

Score vs Response Time (avg)

Total Output Tokens

Score vs Total Output Tokens

Category Breakdown

Anti-AI Tricks	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
MiniMax M2.5	7.9	6.3	83.3%	2		20.82s	286	45,344
Qwen3.6 Plus Preview	10.0	10.0	100.0%	0		9.90s	207	7,557

Combined	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
MiniMax M2.5	4.5	2.1	66.7%	1		60.39s	740	9,713
Qwen3.6 Plus Preview	10.0	10.0	100.0%	0		34.95s	452	13,073

Data parsing and extraction	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
MiniMax M2.5	4.6	1.7	66.7%	2		7.48s	266	3,835
Qwen3.6 Plus Preview	10.0	10.0	100.0%	0		14.95s	270	10,706

Domain specific	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
MiniMax M2.5	2.9	4.4	22.2%	2		237.27s	105,047	133,487
Qwen3.6 Plus Preview	3.0	10.0	0.0%	0		22.08s	49	26,895

General Intelligence	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
MiniMax M2.5	3.8	2.5	33.3%	1		6.63s	25	1,686
Qwen3.6 Plus Preview	5.1	10.0	0.0%	0		27.05s	111	5,232

Instructions following	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
MiniMax M2.5	8.1	6.8	83.3%	1		4.64s	252	1,873
Qwen3.6 Plus Preview	10.0	10.0	100.0%	0		7.54s	102	5,552

Puzzle Solving	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
MiniMax M2.5	5.3	7.2	44.4%	1		11.54s	159	9,547
Qwen3.6 Plus Preview	10.0	10.0	100.0%	0		6.11s	298	6,868

Tool Calling	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
MiniMax M2.5	10.0	10.0	100.0%	0		15.35s	269	937
Qwen3.6 Plus Preview	10.0	10.0	100.0%	0		5.87s	267	1,330

Quick Compare

Switch Comparison Pair

MiniMax M2.5mediumFree AvailablevsQwen3.5-35B-A3Bnone MiniMax M2.5mediumFree AvailablevsHunter Alphanone Gemini 2.5 FlashnonevsMiniMax M2.5mediumFree Available MiniMax M2.5mediumFree AvailablevsQwen3.5-122B-A10Bnone Seed-2.0-LitenonevsMiniMax M2.5mediumFree Available MiniMax M2.5mediumFree AvailablevsGLM 5V Turbonone MiniMax M2.5mediumFree AvailablevsMiMo-V2-Pronone MiniMax M2.5mediumFree AvailablevsQwen3.5-Flashnone MiniMax M2.5mediumFree AvailablevsGPT-5.4none MiniMax M2.5mediumFree AvailablevsQwen3.5-27Bnone Gemini 3 Flash PreviewlowvsQwen3.6 Plus Previewmedium MiniMax M2.5mediumFree AvailablevsGLM 5 Turbonone