Gemini 3.5 Flash vs Qwen3.5-Flash (medium)

Recommended model Gemini 3.5 Flash

It has the best score here (7.0), while responding about 8.5x faster than Qwen3.5-Flash (medium).

Detailed comparison

Metric	Gemini 3.5 Flash Gemini 3.5 Flash none Release: 2026-05-19	Qwen3.5-Flash Qwen3.5-Flash medium Release: 2026-02-24

Metric	Gemini 3.5 Flash Gemini 3.5 Flash none Release: 2026-05-19	Qwen3.5-Flash Qwen3.5-Flash medium Release: 2026-02-24
Score	7.0	6.2
Rank	#87	#125
Reliability	10.0	10.0
Consistency	8.9	7.8
Tests Correct
Attempt pass rate	74.2%	69.7%
Flaky tests	3	6
Total Runs	66	66
Cost per result	7.190	1.361
Total Cost	$1.079	$0.139
Input Price	$1.500 / 1M	$0.065 / 1M
Output Price	$9.000 / 1M	$0.260 / 1M
Total Input Tokens	13,843	118,499
Output Tokens	117,518	12,284
Reasoning Tokens	0	490,610
Response Time (avg)	9.93s	84.82s
Response Time (max)	64.36s	515.38s
Response Time (total)	178.68s	1781.22s

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

none

medium

Category:

Anti-AI Tricks	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.5 Flash	10.0	10.0	100.0%	0		2.53s	492	5,101	0
Qwen3.5-Flash	10.0	10.0	100.0%	0		59.11s	672	383	32,992

Coding	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.5 Flash	8.8	7.8	88.9%	1		34.69s	8,122	75,927	0
Qwen3.5-Flash	3.7	7.2	22.2%	1		58.87s	6,685	302	90,081

Combined	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.5 Flash	3.0	10.0	0.0%	0		0ms	0	0	0
Qwen3.5-Flash	6.4	5.8	66.7%	1		266.58s	94,507	10,679	204,282

Data parsing and extraction	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.5 Flash	6.5	10.0	50.0%	0		8.10s	2,781	5,895	0
Qwen3.5-Flash	7.3	5.9	83.3%	1		56.99s	6,061	235	16,237

Domain specific	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.5 Flash	7.6	7.2	77.8%	1		10.64s	633	17,910	0
Qwen3.5-Flash	5.3	7.2	44.4%	1		146.50s	581	58	43,615

General Intelligence	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.5 Flash	10.0	10.0	100.0%	0		3.46s	486	1,620	0
Qwen3.5-Flash	6.1	3.1	66.7%	1		40.05s	516	99	38,486

Instructions following	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.5 Flash	9.8	10.0	100.0%	0		3.38s	615	3,928	0
Qwen3.5-Flash	10.0	10.0	100.0%	0		63.49s	699	98	14,139

Puzzle Solving	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.5 Flash	10.0	10.0	100.0%	0		3.13s	558	4,640	0
Qwen3.5-Flash	8.2	7.2	88.9%	1		27.61s	381	89	12,457

Tool Calling	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.5 Flash	3.0	10.0	0.0%	0		0ms	0	0	0
Qwen3.5-Flash	10.0	10.0	100.0%	0		10.33s	8,193	309	1,284

Trivia	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.5 Flash	2.8	1.6	33.3%	1		4.87s	156	2,497	0
Qwen3.5-Flash	3.0	10.0	0.0%	0		48.98s	204	32	37,037

Switch Comparison Pair