AI BENCHY Compare

Laguna M.1 vs Qwen: Qwen3.5-Flash

Last updated at: 2026-04-29

Metric	Laguna M.1 Laguna M.1 medium Release: 2026-04-28 Free Available	Qwen3.5-Flash Qwen3.5-Flash none Release: 2026-02-24

Metric	Laguna M.1 Laguna M.1 medium Release: 2026-04-28 Free Available	Qwen3.5-Flash Qwen3.5-Flash none Release: 2026-02-24
Score	6.3	6.2
Rank	#74	#77
Reliability	10.0	N/A
Consistency	8.6	9.6
Tests Correct
Attempt pass rate	53.7%	46.3%
Flaky tests	3	1
Total Runs	54	54
Cost per result	0.000	0.070
Total Cost	$0.000	$0.006
Input Price	$0.000 / 1M	$0.065 / 1M
Output Price	$0.000 / 1M	$0.260 / 1M
Output Tokens	63,822	4,266
Reasoning Tokens	0	0
Response Time (avg)	13.90s	3.25s
Response Time (max)	53.14s	13.73s
Response Time (total)	250.28s	58.44s

Top Models by Score

Score vs Total Cost

Response Time (avg)

Score vs Response Time (avg)

Total Output Tokens

Score vs Total Output Tokens

Category Breakdown

Anti-AI Tricks	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Laguna M.1	6.6	10.0	50.0%	0		9.15s	7,839	0
Qwen3.5-Flash	3.5	8.3	8.3%	1		1.32s	690	0

Coding	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Laguna M.1	4.3	1.1	66.7%	1		35.61s	14,327	0
Qwen3.5-Flash	10.0	10.0	100.0%	0		1.29s	489	0

Combined	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Laguna M.1	3.0	10.0	0.0%	0		53.14s	12,272	0
Qwen3.5-Flash	3.0	10.0	0.0%	0		6.22s	1,794	0

Data parsing and extraction	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Laguna M.1	10.0	10.0	100.0%	0		4.93s	2,296	0
Qwen3.5-Flash	10.0	10.0	100.0%	0		1.57s	243	0

Domain specific	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Laguna M.1	5.3	7.2	44.4%	1		24.14s	19,020	0
Qwen3.5-Flash	7.7	10.0	66.7%	0		905ms	15	0

General Intelligence	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Laguna M.1	4.1	10.0	0.0%	0		6.86s	1,294	0
Qwen3.5-Flash	10.0	10.0	100.0%	0		803ms	100	0

Instructions following	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Laguna M.1	10.0	10.0	100.0%	0		4.30s	1,626	0
Qwen3.5-Flash	6.3	10.0	50.0%	0		8.81s	63	0

Puzzle Solving	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Laguna M.1	3.6	7.2	22.2%	1		6.97s	3,978	0
Qwen3.5-Flash	3.3	10.0	0.0%	0		5.90s	608	0

Tool Calling	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Laguna M.1	10.0	10.0	100.0%	0		6.31s	1,170	0
Qwen3.5-Flash	10.0	10.0	100.0%	0		3.67s	264	0

Quick Compare

Switch Comparison Pair

Laguna Xs.2mediumFree AvailablevsQwen3.5-Flashnone GPT-5 NanomediumvsQwen3.5-Flashnone Laguna M.1mediumFree AvailablevsMiMo-V2-Omninone Laguna M.1mediumFree AvailablevsGLM 5V Turbonone Gemma 4 26B A4BnoneFree AvailablevsLaguna M.1mediumFree Available Seed-2.0-LitenonevsLaguna M.1mediumFree Available Gemini 2.5 FlashnonevsLaguna M.1mediumFree Available Laguna M.1mediumFree AvailablevsQwen3.5-35B-A3Bnone Mercury 2mediumvsQwen3.5-Flashnone Laguna M.1mediumFree AvailablevsQwen3.6 27Bnone Laguna M.1mediumFree AvailablevsGLM 5none DeepSeek V4 PrononevsLaguna M.1mediumFree Available