Gemini 3.1 Flash Lite (minimal) vs Qwen3.6 Flash

Recommended model Gemini 3.1 Flash Lite (minimal)

It has the best score here (6.1), while responding about 2.0x faster than Qwen3.6 Flash.

Detailed comparison

Metric	Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite minimal Release: 2026-05-08	Qwen3.6 Flash Qwen3.6 Flash none Release: 2026-04-20

Metric	Gemini 3.1 Flash Lite Gemini 3.1 Flash Lite minimal Release: 2026-05-08	Qwen3.6 Flash Qwen3.6 Flash none Release: 2026-04-20
Score	6.1	6.1
Rank	#131	#135
Reliability	10.0	10.0
Consistency	8.9	9.6
Tests Correct
Attempt pass rate	51.5%	34.9%
Flaky tests	3	1
Total Runs	66	66
Cost per result	0.465	0.935
Total Cost	$0.047	$0.062
Input Price	$0.250 / 1M	$0.188 / 1M
Output Price	$1.500 / 1M	$1.125 / 1M
Total Input Tokens	119,065	139,788
Output Tokens	11,118	30,947
Reasoning Tokens	0	0
Response Time (avg)	1.86s	3.74s
Response Time (max)	12.97s	48.79s
Response Time (total)	40.88s	82.38s

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

minimal

none

Category:

Anti-AI Tricks	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.1 Flash Lite	8.3	10.0	75.0%	0		1.10s	500	639	0
Qwen3.6 Flash	3.1	10.0	0.0%	0		1.63s	696	1,554	0

Coding	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.1 Flash Lite	5.5	10.0	33.3%	0		831ms	8,126	666	0
Qwen3.6 Flash	5.4	10.0	33.3%	0		1.79s	6,488	889	0

Combined	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.1 Flash Lite	3.0	10.0	0.0%	0		7.75s	94,962	8,988	0
Qwen3.6 Flash	3.8	5.8	33.3%	1		26.50s	113,653	27,098	0

Data parsing and extraction	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		1.04s	7,552	279	0
Qwen3.6 Flash	10.0	10.0	100.0%	0		2.13s	7,794	243	0

Domain specific	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.1 Flash Lite	2.9	7.2	11.1%	1		1.02s	641	15	0
Qwen3.6 Flash	5.3	10.0	33.3%	0		1.11s	789	15	0

General Intelligence	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.1 Flash Lite	4.0	10.0	0.0%	0		791ms	490	63	0
Qwen3.6 Flash	10.0	10.0	100.0%	0		947ms	522	132	0

Instructions following	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		932ms	615	72	0
Qwen3.6 Flash	6.3	10.0	50.0%	0		1.10s	711	66	0

Puzzle Solving	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.1 Flash Lite	6.0	4.6	66.7%	2		2.15s	564	153	0
Qwen3.6 Flash	3.5	10.0	0.0%	0		1.21s	714	669	0

Tool Calling	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.1 Flash Lite	10.0	10.0	100.0%	0		3.51s	5,457	234	0
Qwen3.6 Flash	10.0	10.0	100.0%	0		2.49s	8,211	272	0

Trivia	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.1 Flash Lite	3.0	10.0	0.0%	0		724ms	158	9	0
Qwen3.6 Flash	3.0	10.0	0.0%	0		649ms	210	9	0

Switch Comparison Pair