Gemini 3.5 Flash vs MiMo-V2.5 (medium)

Recommended model MiMo-V2.5 (medium)

Its score stays close to the best score here (6.5 vs 7.0), while costing about 13.3x less than Gemini 3.5 Flash.

Detailed comparison

Metric	Gemini 3.5 Flash Gemini 3.5 Flash none Release: 2026-05-19	MiMo-V2.5 MiMo-V2.5 medium Release: 2026-04-22

Metric	Gemini 3.5 Flash Gemini 3.5 Flash none Release: 2026-05-19	MiMo-V2.5 MiMo-V2.5 medium Release: 2026-04-22
Score	7.0	6.5
Rank	#87	#111
Reliability	10.0	10.0
Consistency	8.9	7.9
Tests Correct
Attempt pass rate	74.2%	69.7%
Flaky tests	3	6
Total Runs	66	66
Cost per result	7.190	3.124
Total Cost	$1.079	$0.082
Input Price	$1.500 / 1M	$0.140 / 1M
Output Price	$9.000 / 1M	$0.280 / 1M
Total Input Tokens	13,843	105,447
Output Tokens	117,518	7,120
Reasoning Tokens	0	230,682
Response Time (avg)	9.93s	32.20s
Response Time (max)	64.36s	162.44s
Response Time (total)	178.68s	708.46s

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

none

medium

Category:

Anti-AI Tricks	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.5 Flash	10.0	10.0	100.0%	0		2.53s	492	5,101	0
MiMo-V2.5	10.0	10.0	100.0%	0		4.14s	621	281	1,739

Coding	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.5 Flash	8.8	7.8	88.9%	1		34.69s	8,122	75,927	0
MiMo-V2.5	6.2	4.7	66.7%	2		97.14s	7,422	557	81,977

Combined	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.5 Flash	3.0	10.0	0.0%	0		0ms	0	0	0
MiMo-V2.5	8.7	6.9	83.3%	1		77.97s	78,669	4,656	39,393

Data parsing and extraction	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.5 Flash	6.5	10.0	50.0%	0		8.10s	2,781	5,895	0
MiMo-V2.5	2.7	5.7	16.7%	1		6.33s	7,746	306	5,714

Domain specific	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.5 Flash	7.6	7.2	77.8%	1		10.64s	633	17,910	0
MiMo-V2.5	5.3	10.0	33.3%	0		34.53s	735	507	49,478

General Intelligence	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.5 Flash	10.0	10.0	100.0%	0		3.46s	486	1,620	0
MiMo-V2.5	5.4	2.5	66.7%	1		5.37s	492	121	418

Instructions following	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.5 Flash	9.8	10.0	100.0%	0		3.38s	615	3,928	0
MiMo-V2.5	9.9	10.0	100.0%	0		1.80s	672	88	801

Puzzle Solving	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.5 Flash	10.0	10.0	100.0%	0		3.13s	558	4,640	0
MiMo-V2.5	8.2	7.2	88.9%	1		20.25s	660	279	33,254

Tool Calling	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.5 Flash	3.0	10.0	0.0%	0		0ms	0	0	0
MiMo-V2.5	10.0	10.0	100.0%	0		7.29s	8,220	303	2,424

Trivia	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.5 Flash	2.8	1.6	33.3%	1		4.87s	156	2,497	0
MiMo-V2.5	3.0	10.0	0.0%	0		51.29s	210	22	15,484

Switch Comparison Pair