AI BENCHY Compare

Google: Gemma 4 31B vs Xiaomi: MiMo-V2-Omni

Last updated at: 2026-05-01

Metric	Gemma 4 31B Gemma 4 31B none Release: 2026-04-02 Free Available	MiMo-V2-Omni MiMo-V2-Omni medium Release: 2026-03-18

Metric	Gemma 4 31B Gemma 4 31B none Release: 2026-04-02 Free Available	MiMo-V2-Omni MiMo-V2-Omni medium Release: 2026-03-18
Score	6.9	7.7
Rank	#64	#49
Reliability	N/A	N/A
Consistency	10.0	9.9
Tests Correct
Attempt pass rate	55.6%	61.1%
Flaky tests	0	0
Total Runs	54	20
Cost per result	0.024	1.383
Total Cost	$0.003	$0.153
Input Price	$0.130 / 1M	$0.400 / 1M
Output Price	$0.380 / 1M	$2.000 / 1M
Output Tokens	1,359	928
Reasoning Tokens	0	72,661
Response Time (avg)	4.02s	16.76s
Response Time (max)	26.13s	158.78s
Response Time (total)	64.33s	301.61s

Top Models by Score

Score vs Total Cost

Response Time (avg)

Score vs Response Time (avg)

Total Output Tokens

Score vs Total Output Tokens

Category Breakdown

Anti-AI Tricks	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Gemma 4 31B	6.5	10.0	50.0%	0		1.85s	45	0
MiMo-V2-Omni	10.0	10.0	100.0%	0		2.11s	112	402

Coding	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Gemma 4 31B	10.0	10.0	100.0%	0		26.13s	699	0
MiMo-V2-Omni	4.0	7.9	0.0%	0		68.55s	265	33,660

Combined	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Gemma 4 31B	3.0	10.0	0.0%	0		0ms	0	0
MiMo-V2-Omni	10.0	10.0	100.0%	0		19.29s	131	2,807

Data parsing and extraction	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Gemma 4 31B	10.0	10.0	100.0%	0		2.25s	285	0
MiMo-V2-Omni	10.0	10.0	100.0%	0		2.29s	87	323

Domain specific	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Gemma 4 31B	7.7	10.0	66.7%	0		3.22s	27	0
MiMo-V2-Omni	3.0	10.0	0.0%	0		55.12s	13	33,279

General Intelligence	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Gemma 4 31B	10.0	10.0	100.0%	0		2.09s	117	0
MiMo-V2-Omni	10.0	10.0	100.0%	0		2.86s	58	202

Instructions following	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Gemma 4 31B	6.5	10.0	50.0%	0		2.84s	78	0
MiMo-V2-Omni	8.3	10.0	50.0%	0		4.92s	35	201

Puzzle Solving	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Gemma 4 31B	5.5	10.0	33.3%	0		2.95s	108	0
MiMo-V2-Omni	6.5	10.0	33.3%	0		3.88s	126	481

Tool Calling	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Gemma 4 31B	3.0	10.0	0.0%	0		0ms	0	0
MiMo-V2-Omni	10.0	10.0	100.0%	0		11.07s	101	1,306

Quick Compare

Switch Comparison Pair

Gemma 4 31BnoneFree AvailablevsGrok 4.20medium DeepSeek V4 ProhighvsGemma 4 31BnoneFree Available Gemma 4 31BnoneFree AvailablevsQwen3.6 27Bmedium Gemma 4 31BnoneFree AvailablevsKimi K2.5medium DeepSeek V4 FlashhighvsMiMo-V2-Omnimedium Gemma 4 31BnoneFree AvailablevsGPT-5 Minimedium GPT-5.3 ChatnonevsMiMo-V2-Omnimedium Qwen3.6 Max PreviewnonevsMiMo-V2-Omnimedium Gemini 3.1 Flash Lite PreviewnonevsMiMo-V2-Omnimedium Gemma 4 31BnoneFree AvailablevsGrok 4.1 Fastmedium GPT-5.2 ChatnonevsMiMo-V2-Omnimedium Gemma 4 31BnoneFree AvailablevsNemotron 3 SupermediumFree Available