AI BENCHY Compare

Xiaomi: MiMo-V2-Omni vs Z.ai: GLM 5.1

Last updated at: 2026-04-29

Metric	MiMo-V2-Omni MiMo-V2-Omni medium Release: 2026-03-18	GLM 5.1 GLM 5.1 medium Release: 2026-04-07

Metric	MiMo-V2-Omni MiMo-V2-Omni medium Release: 2026-03-18	GLM 5.1 GLM 5.1 medium Release: 2026-04-07
Score	7.7	7.8
Rank	#47	#44
Reliability	N/A	N/A
Consistency	9.9	8.6
Tests Correct
Attempt pass rate	61.1%	75.9%
Flaky tests	0	3
Total Runs	20	54
Cost per result	1.383	1.674
Total Cost	$0.153	$0.201
Input Price	$0.400 / 1M	$1.050 / 1M
Output Price	$2.000 / 1M	$3.500 / 1M
Output Tokens	928	8,005
Reasoning Tokens	72,661	49,090
Response Time (avg)	16.76s	24.13s
Response Time (max)	158.78s	118.52s
Response Time (total)	301.61s	410.25s

Top Models by Score

Score vs Total Cost

Response Time (avg)

Score vs Response Time (avg)

Total Output Tokens

Score vs Total Output Tokens

Category Breakdown

Anti-AI Tricks	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
MiMo-V2-Omni	10.0	10.0	100.0%	0		2.11s	112	402
GLM 5.1	10.0	10.0	100.0%	0		8.31s	401	5,122

Coding	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
MiMo-V2-Omni	4.0	7.9	0.0%	0		68.55s	265	33,660
GLM 5.1	4.7	1.6	66.7%	1		118.52s	1,339	13,777

Combined	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
MiMo-V2-Omni	10.0	10.0	100.0%	0		19.29s	131	2,807
GLM 5.1	9.5	10.0	100.0%	0		43.11s	327	4,206

Data parsing and extraction	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
MiMo-V2-Omni	10.0	10.0	100.0%	0		2.29s	87	323
GLM 5.1	10.0	10.0	100.0%	0		9.33s	991	4,552

Domain specific	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
MiMo-V2-Omni	3.0	10.0	0.0%	0		55.12s	13	33,279
GLM 5.1	5.3	10.0	33.3%	0		29.77s	969	11,314

General Intelligence	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
MiMo-V2-Omni	10.0	10.0	100.0%	0		2.86s	58	202
GLM 5.1	10.0	10.0	100.0%	0		20.95s	2,875	2,875

Instructions following	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
MiMo-V2-Omni	8.3	10.0	50.0%	0		4.92s	35	201
GLM 5.1	6.4	5.8	66.7%	1		7.47s	204	1,617

Puzzle Solving	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
MiMo-V2-Omni	6.5	10.0	33.3%	0		3.88s	126	481
GLM 5.1	8.2	7.2	88.9%	1		23.85s	899	5,627

Tool Calling	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
MiMo-V2-Omni	10.0	10.0	100.0%	0		11.07s	101	1,306
GLM 5.1	3.0	10.0	0.0%	0		0ms	0	0

Quick Compare

Switch Comparison Pair

GPT-5.3 ChatnonevsMiMo-V2-Omnimedium DeepSeek V4 FlashhighvsGLM 5.1medium Gemini 3.1 Flash Lite PreviewnonevsGLM 5.1medium GPT-5.2 ChatnonevsGLM 5.1medium GPT-5.3 ChatnonevsGLM 5.1medium DeepSeek V4 FlashhighvsMiMo-V2-Omnimedium Gemini 3.1 Flash Lite PreviewnonevsMiMo-V2-Omnimedium GPT-5.2 ChatnonevsMiMo-V2-Omnimedium Claude Sonnet 4.6nonevsMiMo-V2-Omnimedium Gemini 3.1 Flash Lite PreviewlowvsGLM 5.1medium Gemini 3 Flash PreviewnonevsGLM 5.1medium HY3 PreviewlowFree AvailablevsGLM 5.1medium