Gemini 3.1 Flash Lite Preview (low) vs Qwen3.6 35B A3B (medium)

Recommended model Gemini 3.1 Flash Lite Preview (low)

Its score stays close to the best score here (6.5 vs 6.7), while responding about 3.5x faster than Qwen3.6 35B A3B (medium).

Detailed comparison

Metric	Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview low Release: 2026-03-03	Qwen3.6 35B A3B Qwen3.6 35B A3B medium Release: 2026-04-20

Metric	Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview low Release: 2026-03-03	Qwen3.6 35B A3B Qwen3.6 35B A3B medium Release: 2026-04-20
Score	6.5	6.7
Rank	#114	#98
Reliability	10.0	10.0
Consistency	10.0	9.6
Tests Correct
Attempt pass rate	59.1%	60.6%
Flaky tests	0	1
Total Runs	66	66
Cost per result	4.969	5.712
Total Cost	$0.646	$0.746
Input Price	$0.250 / 1M	$0.140 / 1M
Output Price	$1.500 / 1M	$1.000 / 1M
Total Input Tokens	110,185	85,139
Output Tokens	14,717	61,819
Reasoning Tokens	397,483	678,766
Response Time (avg)	16.70s	58.06s
Response Time (max)	309.35s	817.57s
Response Time (total)	367.47s	1161.18s

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

low

medium

Invalid SVG

Category:

Anti-AI Tricks	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.1 Flash Lite Preview	8.3	10.0	75.0%	0		2.12s	506	462	1,638
Qwen3.6 35B A3B	10.0	10.0	100.0%	0		6.02s	672	1,154	12,385

Coding	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.1 Flash Lite Preview	5.5	10.0	33.3%	0		1.39s	8,138	660	1,060
Qwen3.6 35B A3B	7.7	10.0	66.7%	0		50.55s	5,051	7,929	37,223

Combined	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.1 Flash Lite Preview	3.0	10.0	0.0%	0		160.63s	85,851	12,656	389,079
Qwen3.6 35B A3B	3.0	10.0	0.0%	0		817.57s	68,754	42,187	548,547

Data parsing and extraction	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		3.00s	7,455	291	696
Qwen3.6 35B A3B	10.0	10.0	100.0%	0		12.99s	7,776	2,591	9,968

Domain specific	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.1 Flash Lite Preview	5.3	10.0	33.3%	0		2.36s	641	18	1,212
Qwen3.6 35B A3B	5.3	7.2	44.4%	1		22.50s	771	6,193	39,116

General Intelligence	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.1 Flash Lite Preview	4.0	10.0	0.0%	0		1.54s	490	69	384
Qwen3.6 35B A3B	4.4	9.9	0.0%	0		8.66s	516	129	4,569

Instructions following	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		1.49s	621	72	753
Qwen3.6 35B A3B	10.0	10.0	100.0%	0		7.50s	699	219	7,404

Puzzle Solving	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		1.69s	566	243	1,248
Qwen3.6 35B A3B	8.0	10.0	66.7%	0		5.95s	696	655	9,228

Tool Calling	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		9.54s	5,757	237	993
Qwen3.6 35B A3B	3.0	10.0	0.0%	0		0ms	0	0	0

Trivia	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.1 Flash Lite Preview	3.0	10.0	0.0%	0		1.35s	160	9	420
Qwen3.6 35B A3B	3.0	10.0	0.0%	0		32.90s	204	762	10,326

Switch Comparison Pair