NVIDIA: Nemotron 3 Ultra vs Xiaomi: MiMo-V2.5-Pro

Nemotron 3 Ultra (medium) leads on average score with 7.5 vs 6.9. MiMo-V2.5-Pro (medium) has the lower benchmark cost at $0.187 vs $0.774. Nemotron 3 Ultra (medium) is faster at 32.21s vs 33.92s, with pass rates of 68.2% vs 66.7%.

Recommended modelMiMo-V2.5-Pro (medium)Its score stays close to the best score here (6.9 vs 7.5), while costing about 4.1x less than Nemotron 3 Ultra (medium).

Last updated at: 2026-07-21

Metric	Nemotron 3 Ultra Nemotron 3 Ultra medium Release: 2026-06-04 Free Available	MiMo-V2.5-Pro MiMo-V2.5-Pro medium Release: 2026-04-22

Metric	Nemotron 3 Ultra Nemotron 3 Ultra medium Release: 2026-06-04 Free Available	MiMo-V2.5-Pro MiMo-V2.5-Pro medium Release: 2026-04-22
Score	7.5	6.9
Rank	#55	#88
Reliability	9.8	10.0
Consistency	8.5	8.2
Tests Correct
Attempt pass rate	68.2%	66.7%
Flaky tests	4	5
Total Runs	66	66
Cost per result	0.000	3.218
Total Cost	$0.774	$0.187
Input Price	$0.600 / 1M	$0.435 / 1M
Output Price	$3.600 / 1M	$0.870 / 1M
Total Input Tokens	233,488	139,883
Output Tokens	57,916	15,521
Reasoning Tokens	128,062	130,992
Response Time (avg)	32.21s	33.92s
Response Time (max)	392.56s	197.54s
Response Time (total)	708.65s	746.19s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#55 Nemotron 3 Ultra

medium

Invalid SVG

Cost: $0.000
Time: 300.0s
Tokens: 0 tok

#88 MiMo-V2.5-Pro

medium

Invalid SVG

Cost: $0.000
Time: 300.0s
Tokens: 0 tok

Top Models by Score

Score vs Total Cost

Response Time (avg)

Score vs Response Time (avg)

Total Output Tokens

Score vs Total Output Tokens

Category Breakdown

Category:

Anti-AI Tricks	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Nemotron 3 Ultra	10.0	10.0	100.0%	0		8.62s	780	835	1,485
MiMo-V2.5-Pro	10.0	10.0	100.0%	0		3.26s	621	323	1,179

Coding	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Nemotron 3 Ultra	8.4	7.4	88.9%	1		26.53s	7,686	2,854	17,725
MiMo-V2.5-Pro	6.2	4.7	66.7%	2		92.07s	6,543	780	51,218

Combined	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Nemotron 3 Ultra	6.3	5.8	66.7%	1		218.25s	204,249	40,954	78,561
MiMo-V2.5-Pro	6.9	5.9	66.7%	1		125.45s	114,089	10,854	45,120

Data parsing and extraction	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Nemotron 3 Ultra	10.0	10.0	100.0%	0		5.68s	7,989	473	1,285
MiMo-V2.5-Pro	7.3	5.8	83.3%	1		18.81s	7,746	260	8,383

Domain specific	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Nemotron 3 Ultra	3.5	4.4	33.3%	2		24.90s	858	11,169	16,249
MiMo-V2.5-Pro	5.3	10.0	33.3%	0		37.87s	630	275	17,023

General Intelligence	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Nemotron 3 Ultra	3.7	9.5	0.0%	0		2.52s	360	70	235
MiMo-V2.5-Pro	5.5	10.0	0.0%	0		4.02s	492	155	163

Instructions following	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Nemotron 3 Ultra	9.8	10.0	100.0%	0		6.35s	765	182	1,243
MiMo-V2.5-Pro	9.9	10.0	100.0%	0		2.77s	672	82	803

Puzzle Solving	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Nemotron 3 Ultra	5.5	9.9	33.3%	0		3.54s	792	771	2,055
MiMo-V2.5-Pro	6.7	7.9	55.6%	1		5.31s	660	540	2,181

Tool Calling	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Nemotron 3 Ultra	10.0	10.0	100.0%	0		7.72s	9,781	304	984
MiMo-V2.5-Pro	10.0	10.0	100.0%	0		16.87s	8,220	311	2,908

Trivia	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Nemotron 3 Ultra	3.0	10.0	0.0%	0		38.47s	228	304	8,240
MiMo-V2.5-Pro	3.0	10.0	0.0%	0		12.46s	210	1,941	2,014

Quick Compare

Switch Comparison Pair

GPT-5.6 SolnonevsMiMo-V2.5-Promedium DeepSeek V4 PrononevsMiMo-V2.5-Promedium Step 3.7 FlashhighvsMiMo-V2.5-Promedium GPT-5.5nonevsMiMo-V2.5-Promedium Nemotron 3 UltramediumFree AvailablevsGPT-5.3 Chatnone Nemotron 3 UltramediumFree AvailablevsGPT-5.6 Terralow Gemini 3.5 FlashminimalvsMiMo-V2.5-Promedium Gemini 3.5 FlashnonevsMiMo-V2.5-Promedium Nemotron 3 UltramediumFree AvailablevsQwen3.7 Maxnone DeepSeek V4 ProhighvsNemotron 3 UltramediumFree Available DeepSeek V4 FlashhighvsNemotron 3 UltramediumFree Available Gemini 3 Flash PreviewnonevsMiMo-V2.5-Promedium