Google: Gemini 3.1 Flash Lite Preview vs Qwen: Qwen3.5-35B-A3B

Gemini 3.1 Flash Lite Preview leads on average score with 6.4 vs 6.2. Gemini 3.1 Flash Lite Preview has the lower benchmark cost at $0.052 vs $0.837. Gemini 3.1 Flash Lite Preview is faster at 1.58s vs 112.47s, with pass rates of 57.6% vs 66.7%.

Recommended modelGemini 3.1 Flash Lite PreviewIt has the best score here (6.4), while costing about 16.2x less than Qwen3.5-35B-A3B (medium).

Last updated at: 2026-07-25

Metric	Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview none Release: 2026-03-03	Qwen3.5-35B-A3B Qwen3.5-35B-A3B medium Release: 2026-02-24

Metric	Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview none Release: 2026-03-03	Qwen3.5-35B-A3B Qwen3.5-35B-A3B medium Release: 2026-02-24
Score	6.4	6.2
Rank	#116	#130
Reliability	10.0	10.0
Consistency	9.7	7.6
Tests Correct
Attempt pass rate	57.6%	66.7%
Flaky tests	1	6
Total Runs	66	66
Cost per result	0.431	9.130
Total Cost	$0.052	$0.837
Input Price	$0.250 / 1M	$0.140 / 1M
Output Price	$1.500 / 1M	$1.000 / 1M
Total Input Tokens	120,942	130,388
Output Tokens	14,292	40,630
Reasoning Tokens	0	786,040
Response Time (avg)	1.58s	112.47s
Response Time (max)	9.27s	950.25s
Response Time (total)	34.72s	2474.28s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#116 Gemini 3.1 Flash Lite Preview

none

Cost: $0.003
Time: 4.7s
Tokens: 1,827 tok

#130 Qwen3.5-35B-A3B

medium

Cost: $0.009
Time: 71.4s
Tokens: 8,631 tok

Top Models by Score

Score vs Total Cost

Response Time (avg)

Score vs Response Time (avg)

Total Output Tokens

Score vs Total Output Tokens

Category Breakdown

Category:

Anti-AI Tricks	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.1 Flash Lite Preview	7.5	8.4	66.7%	1		1.04s	504	1,092	0
Qwen3.5-35B-A3B	10.0	10.0	100.0%	0		21.13s	672	798	42,652

Coding	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.1 Flash Lite Preview	5.5	10.0	33.3%	0		967ms	8,128	670	0
Qwen3.5-35B-A3B	5.9	9.3	33.3%	0		206.65s	4,106	23,844	111,462

Combined	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.1 Flash Lite Preview	3.0	10.0	0.0%	0		6.23s	96,386	9,084	0
Qwen3.5-35B-A3B	3.8	5.8	33.3%	1		512.79s	109,184	775	444,948

Data parsing and extraction	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		1.22s	7,550	399	0
Qwen3.5-35B-A3B	7.3	5.9	83.3%	1		59.33s	6,061	235	19,493

Domain specific	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.1 Flash Lite Preview	5.3	10.0	33.3%	0		942ms	641	568	0
Qwen3.5-35B-A3B	4.1	4.4	44.5%	2		88.34s	500	41	46,368

General Intelligence	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.1 Flash Lite Preview	4.0	10.0	0.0%	0		741ms	488	69	0
Qwen3.5-35B-A3B	2.8	1.6	33.3%	1		30.30s	172	20	3,753

Instructions following	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		1.13s	623	574	0
Qwen3.5-35B-A3B	10.0	10.0	100.0%	0		24.45s	699	97	17,361

Puzzle Solving	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		900ms	570	1,045	0
Qwen3.5-35B-A3B	8.2	7.2	88.9%	1		33.13s	597	3,592	26,585

Tool Calling	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		3.39s	5,894	782	0
Qwen3.5-35B-A3B	10.0	10.0	100.0%	0		4.65s	8,193	309	1,365

Trivia	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.1 Flash Lite Preview	3.0	10.0	0.0%	0		814ms	158	9	0
Qwen3.5-35B-A3B	3.0	10.0	0.0%	0		177.35s	204	10,919	72,053

Quick Compare

Switch Comparison Pair