AI BENCHY Compare

Laguna M.1 vs Qwen: Qwen3 Coder Next

Last updated at: 2026-04-29

Metric	Laguna M.1 Laguna M.1 medium Release: 2026-04-28 Free Available	Qwen3 Coder Next Qwen3 Coder Next none Release: 2026-02-03

Metric	Laguna M.1 Laguna M.1 medium Release: 2026-04-28 Free Available	Qwen3 Coder Next Qwen3 Coder Next none Release: 2026-02-03
Score	6.3	5.1
Rank	#73	#113
Reliability	10.0	N/A
Consistency	8.6	9.7
Tests Correct
Attempt pass rate	53.7%	25.9%
Flaky tests	3	1
Total Runs	54	54
Cost per result	0.000	0.188
Total Cost	$0.000	$0.008
Input Price	$0.000 / 1M	$0.140 / 1M
Output Price	$0.000 / 1M	$0.800 / 1M
Output Tokens	63,822	3,617
Reasoning Tokens	0	0
Response Time (avg)	13.90s	10.18s
Response Time (max)	53.14s	45.14s
Response Time (total)	250.28s	122.13s

Top Models by Score

Score vs Total Cost

Response Time (avg)

Score vs Response Time (avg)

Total Output Tokens

Score vs Total Output Tokens

Category Breakdown

Anti-AI Tricks	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Laguna M.1	6.6	10.0	50.0%	0		9.15s	7,839	0
Qwen3 Coder Next	3.6	10.0	0.0%	0		3.31s	1,321	0

Coding	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Laguna M.1	4.3	1.1	66.7%	1		35.61s	14,327	0
Qwen3 Coder Next	7.3	3.7	66.7%	1		3.14s	585	0

Combined	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Laguna M.1	3.0	10.0	0.0%	0		53.14s	12,272	0
Qwen3 Coder Next	3.0	10.0	0.0%	0		45.14s	317	0

Data parsing and extraction	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Laguna M.1	10.0	10.0	100.0%	0		4.93s	2,296	0
Qwen3 Coder Next	6.5	10.0	50.0%	0		1.32s	246	0

Domain specific	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Laguna M.1	5.3	7.2	44.4%	1		24.14s	19,020	0
Qwen3 Coder Next	5.3	10.0	33.3%	0		962ms	26	0

General Intelligence	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Laguna M.1	4.1	10.0	0.0%	0		6.86s	1,294	0
Qwen3 Coder Next	10.0	10.0	100.0%	0		1.34s	152	0

Instructions following	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Laguna M.1	10.0	10.0	100.0%	0		4.30s	1,626	0
Qwen3 Coder Next	4.8	10.0	0.0%	0		7.71s	63	0

Puzzle Solving	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Laguna M.1	3.6	7.2	22.2%	1		6.97s	3,978	0
Qwen3 Coder Next	3.2	10.0	0.0%	0		22.86s	652	0

Tool Calling	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Laguna M.1	10.0	10.0	100.0%	0		6.31s	1,170	0
Qwen3 Coder Next	10.0	10.0	100.0%	0		2.47s	255	0

Quick Compare

Switch Comparison Pair

Nemotron 3 Nano Omni 30b A3b ReasoningmediumFree AvailablevsQwen3 Coder Nextnone Elephant AlphamediumvsQwen3 Coder Nextnone Laguna M.1mediumFree AvailablevsMiMo-V2-Omninone Laguna M.1mediumFree AvailablevsGLM 5V Turbonone Laguna M.1mediumFree AvailablevsQwen3.5-Flashnone MiniMax M2.7mediumvsQwen3 Coder Nextnone Gemma 4 26B A4BnoneFree AvailablevsLaguna M.1mediumFree Available Seed-2.0-LitenonevsLaguna M.1mediumFree Available Gemini 2.5 FlashnonevsLaguna M.1mediumFree Available Laguna M.1mediumFree AvailablevsQwen3.5-35B-A3Bnone DeepSeek V4 PrononevsLaguna M.1mediumFree Available Laguna M.1mediumFree AvailablevsQwen3.6 27Bnone