AI BENCHY Compare

Hunter Alpha vs Qwen: Qwen3.5-9B

Last updated at: 2026-03-12

Metric	Hunter Alpha Hunter Alpha medium Release: Unknown release date	Qwen3.5-9B Qwen3.5-9B none Release: 2026-03-02

Metric	Hunter Alpha Hunter Alpha medium Release: Unknown release date	Qwen3.5-9B Qwen3.5-9B none Release: 2026-03-02
Rank	#35	#60
Avg Score	5.9	3.4
Consistency	7.6	10.0
Cost per result	0.000	0.111
Total Cost	$0.000	$0.005
Tests Correct
Attempt pass rate	68.8%	25.0%
Flaky tests	5	0
Total Runs	48	48
Output Tokens	4,686	2,939
Reasoning Tokens	17,821	0
Response Time (avg)	10.71s	1.06s
Response Time (max)	30.53s	5.91s
Response Time (total)	171.41s	16.95s

Top Models by Score

Score vs Total Cost

Response Time (avg)

Avg Score vs Response Time (avg)

Total Output Tokens

Avg Score vs Total Output Tokens

Category Breakdown

Anti-AI Tricks	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Hunter Alpha	7.0	7.2	88.9%	1		4.93s	441	1,003
Qwen3.5-9B	10.0	9.9	0.0%	0		1.02s	576	0

Combined	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Hunter Alpha	10.0	1.6	66.7%	1		30.53s	792	3,456
Qwen3.5-9B	10.0	10.0	0.0%	0		5.91s	1,255	0

Data parsing and extraction	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Hunter Alpha	9.9	10.0	100.0%	0		23.16s	1,488	8,017
Qwen3.5-9B	9.9	10.0	100.0%	0		847ms	249	0

Domain specific	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Hunter Alpha	10.0	10.0	0.0%	0		10.52s	892	2,406
Qwen3.5-9B	10.0	10.0	0.0%	0		464ms	24	0

General Intelligence	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Hunter Alpha	8.0	3.7	66.7%	1		6.44s	116	260
Qwen3.5-9B	3.0	9.9	0.0%	0		552ms	99	0

Instructions following	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Hunter Alpha	9.5	10.0	100.0%	0		4.18s	208	465
Qwen3.5-9B	5.5	10.0	50.0%	0		514ms	75	0

Puzzle Solving	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Hunter Alpha	4.3	4.7	66.7%	2		5.36s	441	1,310
Qwen3.5-9B	10.0	9.9	0.0%	0		683ms	388	0

Tool Calling	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Hunter Alpha	10.0	10.0	100.0%	0		17.33s	308	904
Qwen3.5-9B	10.0	10.0	100.0%	0		1.27s	273	0

Quick Compare

Switch Comparison Pair

Hunter AlphamediumvsGLM 5none Qwen3.5-9BnonevsGLM 4.7 Flashmedium Hunter AlphamediumvsQwen3.5 Plus 2026-02-15none DeepSeek V3.2nonevsHunter Alphamedium Hunter AlphamediumvsQwen3.5-Flashnone Gemini 2.5 FlashnonevsHunter Alphamedium Claude Sonnet 4.6nonevsHunter Alphamedium Hunter AlphamediumvsQwen3.5-122B-A10Bnone Seed-2.0-LitenonevsHunter Alphamedium Hunter AlphamediumvsQwen3.5-27Bnone Gemini 3.1 Flash Lite PreviewnonevsHunter Alphamedium Hunter AlphamediumvsQwen3.5-35B-A3Bnone