AI BENCHY Compare

Mistral: Mistral Small 4 vs Laguna Xs.2

Last updated at: 2026-04-29

Metric	Mistral Small 4 Mistral Small 4 none Release: 2026-03-16	Laguna Xs.2 Laguna Xs.2 none Release: 2026-04-28 Free Available

Metric	Mistral Small 4 Mistral Small 4 none Release: 2026-03-16	Laguna Xs.2 Laguna Xs.2 none Release: 2026-04-28 Free Available
Score	5.2	5.0
Rank	#109	#118
Reliability	N/A	9.9
Consistency	9.5	10.0
Tests Correct
Attempt pass rate	31.5%	27.8%
Flaky tests	1	0
Total Runs	54	54
Cost per result	0.118	0.000
Total Cost	$0.006	$0.000
Input Price	$0.150 / 1M	$0.000 / 1M
Output Price	$0.600 / 1M	$0.000 / 1M
Output Tokens	2,207	3,824
Reasoning Tokens	0	0
Response Time (avg)	665ms	1.68s
Response Time (max)	1.72s	16.04s
Response Time (total)	11.97s	30.26s

Top Models by Score

Score vs Total Cost

Response Time (avg)

Score vs Response Time (avg)

Total Output Tokens

Score vs Total Output Tokens

Category Breakdown

Anti-AI Tricks	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Mistral Small 4	3.4	7.9	16.7%	1		395ms	182	0
Laguna Xs.2	3.2	10.0	0.0%	0		743ms	933	0

Coding	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Mistral Small 4	4.5	9.0	0.0%	0		1.28s	583	0
Laguna Xs.2	2.5	10.0	0.0%	0		1.96s	866	0

Combined	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Mistral Small 4	3.0	10.0	0.0%	0		1.72s	496	0
Laguna Xs.2	3.0	10.0	0.0%	0		2.01s	521	0

Data parsing and extraction	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Mistral Small 4	10.0	10.0	100.0%	0		822ms	261	0
Laguna Xs.2	10.0	10.0	100.0%	0		646ms	246	0

Domain specific	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Mistral Small 4	5.3	10.0	33.3%	0		367ms	28	0
Laguna Xs.2	5.3	10.0	33.3%	0		371ms	33	0

General Intelligence	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Mistral Small 4	4.0	10.0	0.0%	0		729ms	205	0
Laguna Xs.2	5.0	10.0	0.0%	0		16.04s	200	0

Instructions following	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Mistral Small 4	6.5	10.0	50.0%	0		380ms	69	0
Laguna Xs.2	6.5	10.0	50.0%	0		439ms	81	0

Puzzle Solving	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Mistral Small 4	3.1	9.9	0.0%	0		589ms	170	0
Laguna Xs.2	5.4	10.0	33.3%	0		688ms	552	0

Tool Calling	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Mistral Small 4	10.0	10.0	100.0%	0		1.40s	213	0
Laguna Xs.2	3.0	10.0	0.0%	0		1.93s	392	0

Quick Compare

Switch Comparison Pair

Mistral Small 4nonevsNemotron 3 Nano Omni 30b A3b ReasoningmediumFree Available Mistral Small 4nonevsElephant Alphamedium MiniMax M2.7mediumvsMistral Small 4none Nemotron 3 Nano Omni 30b A3b ReasoningmediumFree AvailablevsLaguna Xs.2noneFree Available Elephant AlphamediumvsLaguna Xs.2noneFree Available MiniMax M2.7mediumvsLaguna Xs.2noneFree Available Laguna Xs.2noneFree AvailablevsQwen3 Coder Nextmedium Laguna Xs.2noneFree AvailablevsGLM 4.7 Flashmedium MiniMax M2.5mediumFree AvailablevsMistral Small 4none Mistral Small 4nonevsQwen3 Coder Nextmedium Mistral Small 4mediumvsLaguna Xs.2noneFree Available Mistral Small 4nonevsGLM 4.7 Flashmedium