AI BENCHY Compare

Elephant Alpha vs Laguna Xs.2

Last updated at: 2026-04-29

Metric	Elephant Alpha Elephant Alpha medium Release: 2026-04-14	Laguna Xs.2 Laguna Xs.2 none Release: 2026-04-28 Free Available

Metric	Elephant Alpha Elephant Alpha medium Release: 2026-04-14	Laguna Xs.2 Laguna Xs.2 none Release: 2026-04-28 Free Available
Score	5.2	5.0
Rank	#106	#118
Reliability	N/A	9.9
Consistency	9.6	10.0
Tests Correct
Attempt pass rate	29.6%	27.8%
Flaky tests	1	0
Total Runs	54	54
Cost per result	0.000	0.000
Total Cost	$0.000	$0.000
Input Price	$0.000 / 1M	$0.000 / 1M
Output Price	$0.000 / 1M	$0.000 / 1M
Output Tokens	2,596	3,824
Reasoning Tokens	0	0
Response Time (avg)	1.27s	1.68s
Response Time (max)	3.70s	16.04s
Response Time (total)	22.82s	30.26s

Top Models by Score

Score vs Total Cost

Response Time (avg)

Score vs Response Time (avg)

Total Output Tokens

Score vs Total Output Tokens

Category Breakdown

Anti-AI Tricks	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Elephant Alpha	6.6	10.0	50.0%	0		1.19s	815	0
Laguna Xs.2	3.2	10.0	0.0%	0		743ms	933	0

Coding	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Elephant Alpha	5.1	3.3	33.3%	1		1.30s	365	0
Laguna Xs.2	2.5	10.0	0.0%	0		1.96s	866	0

Combined	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Elephant Alpha	3.0	10.0	0.0%	0		3.70s	562	0
Laguna Xs.2	3.0	10.0	0.0%	0		2.01s	521	0

Data parsing and extraction	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Elephant Alpha	6.5	10.0	50.0%	0		979ms	246	0
Laguna Xs.2	10.0	10.0	100.0%	0		646ms	246	0

Domain specific	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Elephant Alpha	3.0	10.0	0.0%	0		925ms	24	0
Laguna Xs.2	5.3	10.0	33.3%	0		371ms	33	0

General Intelligence	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Elephant Alpha	4.3	10.0	0.0%	0		920ms	105	0
Laguna Xs.2	5.0	10.0	0.0%	0		16.04s	200	0

Instructions following	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Elephant Alpha	9.8	10.0	100.0%	0		987ms	82	0
Laguna Xs.2	6.5	10.0	50.0%	0		439ms	81	0

Puzzle Solving	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Elephant Alpha	3.7	10.0	0.0%	0		867ms	166	0
Laguna Xs.2	5.4	10.0	33.3%	0		688ms	552	0

Tool Calling	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Elephant Alpha	3.0	10.0	0.0%	0		2.83s	231	0
Laguna Xs.2	3.0	10.0	0.0%	0		1.93s	392	0

Quick Compare

Switch Comparison Pair

Elephant AlphamediumvsGrok 4.20none Mistral Small 4nonevsElephant Alphamedium gpt-oss-120bnoneFree AvailablevsElephant Alphamedium DeepSeek V4 FlashnonevsElephant Alphamedium Trinity Large PreviewnonevsElephant Alphamedium GPT-5.4 MininonevsElephant Alphamedium Ling-2.6-flashnoneFree AvailablevsElephant Alphamedium Elephant AlphamediumvsQwen3 Coder Nextnone Elephant AlphamediumvsMiMo-V2.5none Elephant AlphamediumvsQwen3.6 35B A3Bnone Nemotron 3 SupernoneFree AvailablevsElephant Alphamedium Nemotron 3 Nano Omni 30b A3b ReasoningmediumFree AvailablevsLaguna Xs.2noneFree Available