Claude Sonnet 4.6 (medium) vs Qwen3.6 Plus (medium)

Recommended model Qwen3.6 Plus (medium)

It has the best score here (7.8), while costing about 5.1x less than Claude Sonnet 4.6 (medium).

Detailed comparison

Metric	Claude Sonnet 4.6 Claude Sonnet 4.6 medium Release: 2026-02-17	Qwen3.6 Plus Qwen3.6 Plus medium Release: 2026-04-20

Metric	Claude Sonnet 4.6 Claude Sonnet 4.6 medium Release: 2026-02-17	Qwen3.6 Plus Qwen3.6 Plus medium Release: 2026-04-20
Score	7.8	7.8
Rank	#47	#44
Reliability	10.0	10.0
Consistency	9.2	9.3
Tests Correct
Attempt pass rate	66.7%	71.2%
Flaky tests	2	2
Total Runs	66	66
Cost per result	14.692	1.514
Total Cost	$2.057	$0.405
Input Price	$3.000 / 1M	$0.325 / 1M
Output Price	$15.000 / 1M	$1.950 / 1M
Total Input Tokens	106,292	97,689
Output Tokens	80,748	6,412
Reasoning Tokens	35,117	184,825
Response Time (avg)	25.91s	43.12s
Response Time (max)	140.96s	291.55s
Response Time (total)	362.78s	905.53s

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

medium

Invalid SVG

medium

Category:

Anti-AI Tricks	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Claude Sonnet 4.6	6.5	10.0	50.0%	0		2.98s	789	1,046	1,093
Qwen3.6 Plus	10.0	10.0	100.0%	0		9.90s	672	207	7,557

Coding	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Claude Sonnet 4.6	5.7	6.6	44.4%	1		33.29s	6,995	16,089	3,686
Qwen3.6 Plus	6.1	7.8	44.4%	1		153.12s	7,098	58	50,586

Combined	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Claude Sonnet 4.6	10.0	10.0	100.0%	0		93.65s	75,531	31,916	9,109
Qwen3.6 Plus	10.0	10.0	100.0%	0		163.25s	71,058	5,011	55,925

Data parsing and extraction	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Claude Sonnet 4.6	10.0	10.0	100.0%	0		13.90s	8,676	649	742
Qwen3.6 Plus	10.0	10.0	100.0%	0		14.95s	7,782	270	10,706

Domain specific	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Claude Sonnet 4.6	2.9	7.2	11.1%	1		0ms	471	25,790	16,919
Qwen3.6 Plus	2.9	7.2	11.1%	1		29.59s	771	56	33,464

General Intelligence	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Claude Sonnet 4.6	10.0	10.0	100.0%	0		4.94s	564	256	433
Qwen3.6 Plus	5.1	10.0	0.0%	0		27.05s	516	111	5,232

Instructions following	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Claude Sonnet 4.6	10.0	10.0	100.0%	0		2.61s	792	318	552
Qwen3.6 Plus	10.0	10.0	100.0%	0		7.54s	699	102	5,552

Puzzle Solving	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Claude Sonnet 4.6	10.0	10.0	100.0%	0		5.31s	816	592	646
Qwen3.6 Plus	10.0	10.0	100.0%	0		6.34s	696	309	6,712

Tool Calling	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Claude Sonnet 4.6	10.0	10.0	100.0%	0		7.48s	11,454	655	351
Qwen3.6 Plus	10.0	10.0	100.0%	0		5.87s	8,193	267	1,330

Trivia	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Claude Sonnet 4.6	3.0	10.0	0.0%	0		30.09s	204	3,437	1,586
Qwen3.6 Plus	3.0	10.0	0.0%	0		47.51s	204	21	7,761

Switch Comparison Pair