Gemini 3.1 Flash Lite Preview vs Qwen3.6 27B (medium)

Recommended model Gemini 3.1 Flash Lite Preview

Its score stays close to the best score here (6.4 vs 6.5), while costing about 13.2x less than Qwen3.6 27B (medium).

Detailed comparison

Metric	Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview none Release: 2026-03-03	Qwen3.6 27B Qwen3.6 27B medium Release: 2026-04-20

Metric	Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview none Release: 2026-03-03	Qwen3.6 27B Qwen3.6 27B medium Release: 2026-04-20
Score	6.4	6.5
Rank	#116	#109
Reliability	10.0	10.0
Consistency	9.7	8.0
Tests Correct
Attempt pass rate	57.6%	59.1%
Flaky tests	1	6
Total Runs	66	66
Cost per result	0.431	7.319
Total Cost	$0.052	$0.680
Input Price	$0.250 / 1M	$0.290 / 1M
Output Price	$1.500 / 1M	$2.400 / 1M
Total Input Tokens	120,942	106,167
Output Tokens	14,292	32,889
Reasoning Tokens	0	241,303
Response Time (avg)	1.58s	106.32s
Response Time (max)	9.27s	1085.11s
Response Time (total)	34.72s	2339.12s

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

none

medium

Category:

Anti-AI Tricks	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.1 Flash Lite Preview	7.5	8.4	66.7%	1		1.04s	504	1,092	0
Qwen3.6 27B	8.3	10.0	75.0%	0		12.62s	453	582	4,311

Coding	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.1 Flash Lite Preview	5.5	10.0	33.3%	0		967ms	8,128	670	0
Qwen3.6 27B	7.7	10.0	66.7%	0		142.99s	5,051	7,968	43,367

Combined	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.1 Flash Lite Preview	3.0	10.0	0.0%	0		6.23s	96,386	9,084	0
Qwen3.6 27B	6.7	3.7	50.0%	2		584.09s	81,895	18,788	133,471

Data parsing and extraction	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		1.22s	7,550	399	0
Qwen3.6 27B	3.5	1.4	50.0%	2		37.30s	7,778	568	9,404

Domain specific	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.1 Flash Lite Preview	5.3	10.0	33.3%	0		942ms	641	568	0
Qwen3.6 27B	2.9	7.2	11.1%	1		73.38s	662	3,510	20,352

General Intelligence	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.1 Flash Lite Preview	4.0	10.0	0.0%	0		741ms	488	69	0
Qwen3.6 27B	6.5	3.4	66.7%	1		39.53s	516	81	3,045

Instructions following	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		1.13s	623	574	0
Qwen3.6 27B	10.0	10.0	100.0%	0		37.96s	699	346	6,548

Puzzle Solving	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		900ms	570	1,045	0
Qwen3.6 27B	7.7	10.0	66.7%	0		61.14s	696	255	12,044

Tool Calling	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.1 Flash Lite Preview	10.0	10.0	100.0%	0		3.39s	5,894	782	0
Qwen3.6 27B	10.0	10.0	100.0%	0		16.88s	8,213	390	2,954

Trivia	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 3.1 Flash Lite Preview	3.0	10.0	0.0%	0		814ms	158	9	0
Qwen3.6 27B	3.0	10.0	0.0%	0		80.99s	204	401	5,807

Switch Comparison Pair