MiniMax M2.7 (medium) vs Qwen3.6 35B A3B

Rank: #186
Total Output Tokens: 137,594
Response Time (avg): 41.28s
Total Cost: $0.163

Rank: #175
Total Output Tokens: 46,957
Response Time (avg): 5.52s
Total Cost: $0.061

Recommended model Qwen3.6 35B A3B

It has the best score here (5.3), while costing about 2.7x less than MiniMax M2.7 (medium).

Detailed comparison

Metric	MiniMax M2.7 MiniMax M2.7 medium Release: 2026-03-18	Qwen3.6 35B A3B Qwen3.6 35B A3B none Release: 2026-04-20

Metric	MiniMax M2.7 MiniMax M2.7 medium Release: 2026-03-18	Qwen3.6 35B A3B Qwen3.6 35B A3B none Release: 2026-04-20
Score	5.0	5.3
Rank	#186	#175
Reliability	10.0	10.0
Consistency	6.6	7.7
Tests Correct
Attempt pass rate	45.5%	31.8%
Flaky tests	9	6
Total Runs	66	66
Cost per result	3.906	1.496
Total Cost	$0.163	$0.061
Input Price	$0.250 / 1M	$0.140 / 1M
Output Price	$1.000 / 1M	$1.000 / 1M
Total Input Tokens	114,518	93,979
Output Tokens	18,558	46,957
Reasoning Tokens	119,036	0
Response Time (avg)	41.28s	5.52s
Response Time (max)	196.21s	39.54s
Response Time (total)	866.81s	110.40s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#186 MiniMax M2.7

medium

Cost: $0.022
Time: 22.8s
Tokens: 9,250 tok

#175 Qwen3.6 35B A3B

none

Cost: $0.008
Time: 30.1s
Tokens: 6,317 tok

Top Models by Score

Score vs Total Cost

Response Time (avg)

Score vs Response Time (avg)

Total Output Tokens

Score vs Total Output Tokens

Category Breakdown

Category:

Anti-AI Tricks	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
MiniMax M2.7	7.9	6.3	83.3%	2		40.32s	654	3,010	17,716
Qwen3.6 35B A3B	3.6	7.6	16.7%	1		2.10s	696	1,571	0

Coding	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
MiniMax M2.7	5.7	9.1	33.3%	0		101.89s	2,961	1,231	38,841
Qwen3.6 35B A3B	5.5	10.0	33.3%	0		8.77s	7,911	11,161	0

Combined	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
MiniMax M2.7	3.8	1.6	50.0%	2		72.12s	94,380	9,946	33,704
Qwen3.6 35B A3B	3.8	5.8	33.3%	1		39.54s	74,650	19,202	0

Data parsing and extraction	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
MiniMax M2.7	6.3	5.8	66.7%	1		21.95s	7,152	187	5,882
Qwen3.6 35B A3B	10.0	10.0	100.0%	0		1.46s	7,788	248	0

Domain specific	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
MiniMax M2.7	3.0	10.0	0.0%	0		19.00s	245	8	2,796
Qwen3.6 35B A3B	3.5	4.4	33.3%	2		7.45s	781	11,381	0

General Intelligence	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
MiniMax M2.7	3.9	2.5	33.3%	1		38.70s	486	92	5,204
Qwen3.6 35B A3B	4.4	3.0	33.3%	1		3.51s	520	1,545	0

Instructions following	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
MiniMax M2.7	3.8	5.8	33.3%	1		12.80s	687	350	2,600
Qwen3.6 35B A3B	6.2	5.8	66.7%	1		1.86s	709	1,264	0

Puzzle Solving	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
MiniMax M2.7	5.9	7.2	55.6%	1		24.87s	675	362	7,840
Qwen3.6 35B A3B	3.2	9.9	0.0%	0		1.07s	714	573	0

Tool Calling	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
MiniMax M2.7	4.7	1.6	66.7%	1		12.05s	7,067	304	1,001
Qwen3.6 35B A3B	3.0	10.0	0.0%	0		0ms	0	0	0

Trivia	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
MiniMax M2.7	3.0	10.0	0.0%	0		22.77s	211	3,068	3,452
Qwen3.6 35B A3B	3.0	10.0	0.0%	0		414ms	210	12	0

Quick Compare

Switch Comparison Pair

MiniMax M2.7mediumvsLaguna S 2.1lowFree Available North Mini CodenoneFree AvailablevsMiniMax M2.7medium DeepSeek V3.2nonevsMiniMax M2.7medium Laguna S 2.1highFree AvailablevsQwen3.6 35B A3Bnone MiniMax M2.7mediumvsQwen3.5-9Bnone MiniMax M2.7mediumvsMiMo-V2.5none KAT-Coder-Air V2.5lowvsQwen3.6 35B A3Bnone MiniMax M2.7mediumvsGPT-4o-mininone Laguna S 2.1mediumFree AvailablevsQwen3.6 35B A3Bnone MiniMax M2.7mediumvsQwen3 Coder Nextnone MiniMax M2.7mediumvsMistral Small 4none MiniMax M2.7mediumvsGLM 4.7 Flashnone