Nemotron 3 Ultra vs Qwen3.5-35B-A3B (medium)

Recommended model Nemotron 3 Ultra

Its score stays close to the best score here (6.1 vs 6.2), while costing about 8.8x less than Qwen3.5-35B-A3B (medium).

Detailed comparison

Metric	Nemotron 3 Ultra Nemotron 3 Ultra none Release: 2026-06-04 Free Available	Qwen3.5-35B-A3B Qwen3.5-35B-A3B medium Release: 2026-02-24

Metric	Nemotron 3 Ultra Nemotron 3 Ultra none Release: 2026-06-04 Free Available	Qwen3.5-35B-A3B Qwen3.5-35B-A3B medium Release: 2026-02-24
Score	6.1	6.2
Rank	#144	#133
Reliability	10.0	10.0
Consistency	9.3	7.6
Tests Correct
Attempt pass rate	42.4%	66.7%
Flaky tests	2	6
Total Runs	66	66
Cost per result	0.000	9.130
Total Cost	$0.095	$0.837
Input Price	$0.600 / 1M	$0.140 / 1M
Output Price	$3.600 / 1M	$1.000 / 1M
Total Input Tokens	101,275	130,388
Output Tokens	9,474	40,630
Reasoning Tokens	0	786,040
Response Time (avg)	3.87s	112.47s
Response Time (max)	37.50s	950.25s
Response Time (total)	85.15s	2474.28s

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

none

medium

Category:

Anti-AI Tricks	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Nemotron 3 Ultra	3.5	8.0	16.7%	1		2.35s	696	239	0
Qwen3.5-35B-A3B	10.0	10.0	100.0%	0		21.13s	672	798	42,652

Coding	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Nemotron 3 Ultra	5.5	10.0	33.3%	0		1.02s	7,623	369	0
Qwen3.5-35B-A3B	5.9	9.3	33.3%	0		206.65s	4,106	23,844	111,462

Combined	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Nemotron 3 Ultra	3.0	10.0	0.0%	0		21.14s	73,507	7,693	0
Qwen3.5-35B-A3B	3.8	5.8	33.3%	1		512.79s	109,184	775	444,948

Data parsing and extraction	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Nemotron 3 Ultra	10.0	10.0	100.0%	0		1.94s	7,944	249	0
Qwen3.5-35B-A3B	7.3	5.9	83.3%	1		59.33s	6,061	235	19,493

Domain specific	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Nemotron 3 Ultra	5.3	10.0	33.3%	0		698ms	789	27	0
Qwen3.5-35B-A3B	4.1	4.4	44.5%	2		88.34s	500	41	46,368

General Intelligence	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Nemotron 3 Ultra	5.0	10.0	0.0%	0		13.49s	516	101	0
Qwen3.5-35B-A3B	2.8	1.6	33.3%	1		30.30s	172	20	3,753

Instructions following	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Nemotron 3 Ultra	10.0	10.0	100.0%	0		1.46s	723	69	0
Qwen3.5-35B-A3B	10.0	10.0	100.0%	0		24.45s	699	97	17,361

Puzzle Solving	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Nemotron 3 Ultra	5.9	7.2	55.6%	1		1.06s	726	352	0
Qwen3.5-35B-A3B	8.2	7.2	88.9%	1		33.13s	597	3,592	26,585

Tool Calling	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Nemotron 3 Ultra	10.0	10.0	100.0%	0		2.99s	8,544	264	0
Qwen3.5-35B-A3B	10.0	10.0	100.0%	0		4.65s	8,193	309	1,365

Trivia	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Nemotron 3 Ultra	3.0	10.0	0.0%	0		1.83s	207	111	0
Qwen3.5-35B-A3B	3.0	10.0	0.0%	0		177.35s	204	10,919	72,053

Switch Comparison Pair