AI BENCHY Compare

IBM: Granite 4.1 8B vs MiniMax: MiniMax M2.7

Summary

Granite 4.1 8B vs MiniMax M2.7 benchmark comparison: MiniMax M2.7 leads on average score with 5.2 vs 4.0. Granite 4.1 8B has the lower benchmark cost at $0.003 vs $0.104. Granite 4.1 8B is faster at 728ms vs 38.18s, with pass rates of 9.5% vs 46.0%.

Recommended model: Granite 4.1 8B - It offers the best overall trade-off: a competitive score (4.0), lower cost than MiniMax M2.7, and balanced response time.

Last updated at: 2026-06-12

Metric	Granite 4.1 8B Granite 4.1 8B none Release: 2026-05-01	MiniMax M2.7 MiniMax M2.7 medium Release: 2026-03-18

Metric	Granite 4.1 8B Granite 4.1 8B none Release: 2026-05-01	MiniMax M2.7 MiniMax M2.7 medium Release: 2026-03-18
Score	4.0	5.2
Rank	#163	#134
Reliability	10.0	10.0
Consistency	10.0	6.8
Tests Correct
Attempt pass rate	9.5%	46.0%
Flaky tests	0	8
Total Runs	63	63
Cost per result	0.131	2.494
Total Cost	$0.003	$0.104
Input Price	$0.050 / 1M	$0.250 / 1M
Output Price	$0.100 / 1M	$1.000 / 1M
Total Input Tokens	46,285	34,371
Output Tokens	2,911	8,981
Reasoning Tokens	0	89,812
Response Time (avg)	728ms	38.18s
Response Time (max)	2.17s	196.21s
Response Time (total)	15.29s	763.60s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#163 IBM: Granite 4.1 8B

none

Cost: $0.001
Time: 3.2s
Tokens: 491 tok

#134 MiniMax M2.7

medium

Cost: $0.022
Time: 22.8s
Tokens: 9,250 tok

Top Models by Score

Score vs Total Cost

Response Time (avg)

Score vs Response Time (avg)

Total Output Tokens

Score vs Total Output Tokens

Category Breakdown

Anti-AI Tricks	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Granite 4.1 8B	4.9	10.0	25.0%	0		844ms	645	903	0
MiniMax M2.7	7.9	6.3	83.3%	2		40.32s	654	3,010	17,716

Coding	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Granite 4.1 8B	4.5	10.0	0.0%	0		775ms	8,344	525	0
MiniMax M2.7	5.7	9.1	33.3%	0		101.89s	2,961	1,231	38,841

Combined	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Granite 4.1 8B	3.0	10.0	0.0%	0		1.88s	19,089	396	0
MiniMax M2.7	4.7	1.6	66.7%	1		41.03s	14,233	369	4,480

Data parsing and extraction	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Granite 4.1 8B	3.0	10.0	0.0%	0		575ms	7,617	195	0
MiniMax M2.7	6.3	5.8	66.7%	1		21.95s	7,152	187	5,882

Domain specific	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Granite 4.1 8B	3.0	10.0	0.0%	0		357ms	768	24	0
MiniMax M2.7	3.0	10.0	0.0%	0		19.00s	245	8	2,796

General Intelligence	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Granite 4.1 8B	4.0	10.0	0.0%	0		499ms	528	115	0
MiniMax M2.7	3.9	2.5	33.3%	1		38.70s	486	92	5,204

Instructions following	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Granite 4.1 8B	3.6	9.9	0.0%	0		344ms	687	66	0
MiniMax M2.7	3.8	5.8	33.3%	1		12.80s	687	350	2,600

Puzzle Solving	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Granite 4.1 8B	3.2	10.0	0.0%	0		608ms	672	432	0
MiniMax M2.7	5.9	7.2	55.6%	1		24.87s	675	362	7,840

Tool Calling	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Granite 4.1 8B	10.0	10.0	100.0%	0		2.17s	7,719	243	0
MiniMax M2.7	4.7	1.6	66.7%	1		12.05s	7,067	304	1,001

Trivia	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Granite 4.1 8B	3.0	10.0	0.0%	0		306ms	216	12	0
MiniMax M2.7	3.0	10.0	0.0%	0		22.77s	211	3,068	3,452

Quick Compare

Switch Comparison Pair

MiniMax M2.7mediumvsQwen3.6 35B A3Bnone MiniMax M2.7mediumvsMistral Small 4none MiniMax M2.7mediumvsQwen3 Coder Nextnone MiniMax M2.7mediumvsMiMo-V2.5none DeepSeek V3.2nonevsMiniMax M2.7medium MiniMax M2.7mediumvsQwen3.5-9Bnone MiniMax M2.7mediumvsQwen3.5-122B-A10Bnone MiniMax M2.7mediumvsGPT-5.4 Mininone MiniMax M2.7mediumvsGrok 4.20none MiniMax M2.7mediumvsGLM 5 Turbonone Trinity Large PreviewnonevsMiniMax M2.7medium Granite 4.1 8BnonevsQwen3.5-9Bmedium