MiniMax M2.5 (medium) vs GPT-4o-mini

Recommended model GPT-4o-mini

It has the best score here (5.0), while costing about 35.0x less than MiniMax M2.5 (medium).

Detailed comparison

Metric	MiniMax M2.5 MiniMax M2.5 medium Release: 2026-02-12	GPT-4o-mini GPT-4o-mini none Release: 2024-07-18

Metric	MiniMax M2.5 MiniMax M2.5 medium Release: 2026-02-12	GPT-4o-mini GPT-4o-mini none Release: 2024-07-18
Score	4.6	5.0
Rank	#212	#195
Reliability	10.0	10.0
Consistency	6.2	9.9
Tests Correct
Attempt pass rate	45.5%	22.7%
Flaky tests	10	0
Total Runs	66	66
Cost per result	8.648	0.195
Total Cost	$0.340	$0.010
Input Price	$0.150 / 1M	$0.150 / 1M
Output Price	$0.900 / 1M	$0.600 / 1M
Total Input Tokens	142,561	53,136
Output Tokens	125,442	2,911
Reasoning Tokens	339,935	0
Response Time (avg)	68.27s	1.99s
Response Time (max)	251.36s	7.58s
Response Time (total)	955.75s	29.86s

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

medium

Invalid SVG

none

Category:

Anti-AI Tricks	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
MiniMax M2.5	7.9	6.3	83.3%	2		20.82s	612	286	45,344
GPT-4o-mini	4.8	10.0	25.0%	0		1.34s	618	186	0

Coding	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
MiniMax M2.5	3.4	9.1	0.0%	0		188.58s	6,076	357	106,177
GPT-4o-mini	3.2	9.6	0.0%	0		1.63s	7,314	367	0

Combined	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
MiniMax M2.5	3.7	1.8	50.0%	2		83.19s	119,959	16,687	18,834
GPT-4o-mini	3.0	10.0	0.0%	0		6.32s	29,916	1,497	0

Data parsing and extraction	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
MiniMax M2.5	4.6	1.7	66.7%	2		7.48s	6,584	266	3,835
GPT-4o-mini	10.0	10.0	100.0%	0		1.27s	7,161	183	0

Domain specific	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
MiniMax M2.5	2.9	4.4	22.2%	2		237.27s	308	105,047	133,487
GPT-4o-mini	3.0	10.0	0.0%	0		637ms	732	15	0

General Intelligence	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
MiniMax M2.5	3.8	2.5	33.3%	1		6.63s	492	25	1,686
GPT-4o-mini	4.0	10.0	0.0%	0		909ms	480	66	0

Instructions following	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
MiniMax M2.5	7.5	10.0	50.0%	0		621ms	699	156	1,495
GPT-4o-mini	6.3	10.0	50.0%	0		1.11s	666	69	0

Puzzle Solving	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
MiniMax M2.5	5.3	7.2	44.4%	1		11.21s	495	1,069	9,605
GPT-4o-mini	3.5	10.0	0.0%	0		1.21s	651	308	0

Tool Calling	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
MiniMax M2.5	10.0	10.0	100.0%	0		15.35s	7,123	269	937
GPT-4o-mini	10.0	10.0	100.0%	0		2.51s	5,400	205	0

Trivia	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
MiniMax M2.5	3.0	10.0	0.0%	0		80.79s	213	1,280	18,535
GPT-4o-mini	3.0	10.0	0.0%	0		794ms	198	15	0

Switch Comparison Pair