Gemini 3.5 Flash vs Qwen3.5-122B-A10B (medium)

Recommended model Gemini 3.5 Flash

Its score stays close to the best score here (7.0 vs 7.1), while responding about 6.5x faster than Qwen3.5-122B-A10B (medium).

Detailed comparison

Metric	Gemini 3.5 Flash Gemini 3.5 Flash none Release: 2026-05-19	Qwen3.5-122B-A10B Qwen3.5-122B-A10B medium Release: 2026-02-24

Metric	Gemini 3.5 Flash Gemini 3.5 Flash none Release: 2026-05-19	Qwen3.5-122B-A10B Qwen3.5-122B-A10B medium Release: 2026-02-24
Score	7.0	7.1
Rank	#89	#82
Reliability	10.0	10.0
Consistency	8.9	8.5
Tests Correct
Attempt pass rate	74.2%	71.2%
Flaky tests	3	4
Total Runs	66	66
Cost per result	7.190	8.509
Total Cost	$1.079	$1.046
Input Price	$1.500 / 1M	$0.260 / 1M
Output Price	$9.000 / 1M	$2.080 / 1M
Total Input Tokens	13,843	124,771
Output Tokens	117,518	44,077
Reasoning Tokens	0	443,141
Response Time (avg)	9.93s	64.16s
Response Time (max)	64.36s	519.30s
Response Time (total)	178.68s	1411.60s

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

none

medium

Category:

Anti-AI Tricks	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.5 Flash	10.0	10.0	100.0%	0		2.53s	492	5,101	0
Qwen3.5-122B-A10B	10.0	10.0	100.0%	0		9.75s	672	269	16,835

Coding	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.5 Flash	8.8	7.8	88.9%	1		34.69s	8,122	75,927	0
Qwen3.5-122B-A10B	6.0	7.2	55.6%	1		114.48s	7,630	8,057	82,578

Combined	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.5 Flash	3.0	10.0	0.0%	0		0ms	0	0	0
Qwen3.5-122B-A10B	6.4	5.8	66.7%	1		313.55s	97,886	18,373	203,450

Data parsing and extraction	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.5 Flash	6.5	10.0	50.0%	0		8.10s	2,781	5,895	0
Qwen3.5-122B-A10B	10.0	10.0	100.0%	0		23.41s	7,782	270	16,558

Domain specific	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.5 Flash	7.6	7.2	77.8%	1		10.64s	633	17,910	0
Qwen3.5-122B-A10B	2.9	7.2	11.1%	1		63.40s	771	15,537	64,889

General Intelligence	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.5 Flash	10.0	10.0	100.0%	0		3.46s	486	1,620	0
Qwen3.5-122B-A10B	3.4	2.2	33.3%	1		34.11s	344	66	7,592

Instructions following	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.5 Flash	9.8	10.0	100.0%	0		3.38s	615	3,928	0
Qwen3.5-122B-A10B	10.0	10.0	100.0%	0		9.88s	593	77	7,372

Puzzle Solving	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.5 Flash	10.0	10.0	100.0%	0		3.13s	558	4,640	0
Qwen3.5-122B-A10B	10.0	10.0	100.0%	0		17.89s	696	284	27,575

Tool Calling	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.5 Flash	3.0	10.0	0.0%	0		0ms	0	0	0
Qwen3.5-122B-A10B	10.0	10.0	100.0%	0		4.60s	8,193	322	1,226

Trivia	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.5 Flash	2.8	1.6	33.3%	1		4.87s	156	2,497	0
Qwen3.5-122B-A10B	3.0	10.0	0.0%	0		52.87s	204	822	15,066

Switch Comparison Pair