AI BENCHY Compare

Cobuddy vs Elephant Alpha

Last updated at: 2026-05-22

Metric	Cobuddy Cobuddy medium Release: 2026-05-06 Free Available	Elephant Alpha Elephant Alpha medium Release: 2026-04-14

Metric	Cobuddy Cobuddy medium Release: 2026-05-06 Free Available	Elephant Alpha Elephant Alpha medium Release: 2026-04-14
Score	5.7	5.4
Rank	#105	#122
Reliability	9.9	N/A
Consistency	7.0	9.6
Tests Correct
Attempt pass rate	51.7%	33.3%
Flaky tests	7	1
Total Runs	60	60
Cost per result	0.000	0.000
Total Cost	$0.000	$0.000
Input Price	$0.000 / 1M	$0.000 / 1M
Output Price	$0.000 / 1M	$0.000 / 1M
Output Tokens	1,663	2,596
Reasoning Tokens	116,522	0
Response Time (avg)	39.91s	1.27s
Response Time (max)	309.02s	3.70s
Response Time (total)	798.21s	22.82s

Top Models by Score

Score vs Total Cost

Response Time (avg)

Score vs Response Time (avg)

Total Output Tokens

Score vs Total Output Tokens

Category Breakdown

Anti-AI Tricks	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Cobuddy	8.7	7.9	91.7%	1		10.00s	98	4,666
Elephant Alpha	6.6	10.0	50.0%	0		1.19s	815	0

Coding	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Cobuddy	4.1	5.1	33.3%	1		79.17s	358	30,138
Elephant Alpha	4.0	6.7	16.7%	1		1.30s	365	0

Combined	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Cobuddy	3.0	10.0	0.0%	0		47.38s	465	7,265
Elephant Alpha	3.0	10.0	0.0%	0		3.70s	562	0

Data parsing and extraction	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Cobuddy	6.3	5.8	66.7%	1		17.36s	275	5,591
Elephant Alpha	6.5	10.0	50.0%	0		979ms	246	0

Domain specific	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Cobuddy	2.9	4.4	22.2%	2		128.15s	10	49,454
Elephant Alpha	3.0	10.0	0.0%	0		925ms	24	0

General Intelligence	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Cobuddy	4.2	9.9	0.0%	0		23.23s	76	3,782
Elephant Alpha	4.3	10.0	0.0%	0		920ms	105	0

Instructions following	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Cobuddy	9.8	10.0	100.0%	0		11.60s	64	2,842
Elephant Alpha	9.8	10.0	100.0%	0		987ms	82	0

Puzzle Solving	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Cobuddy	3.5	4.4	33.3%	2		12.91s	175	5,627
Elephant Alpha	5.3	10.0	33.3%	0		867ms	166	0

Tool Calling	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Cobuddy	10.0	10.0	100.0%	0		11.19s	133	294
Elephant Alpha	3.0	10.0	0.0%	0		2.83s	231	0

Trivia	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Cobuddy	3.0	10.0	0.0%	0		36.98s	9	6,863
Elephant Alpha	0.0	0.0	0.0%	0		0ms	0	0

Quick Compare

Switch Comparison Pair

CobuddymediumFree AvailablevsOwl Alphanone Elephant AlphamediumvsQwen3.5-122B-A10Bnone Elephant AlphamediumvsGrok 4.20none CobuddymediumFree AvailablevsQwen3.6 27Bnone CobuddymediumFree AvailablevsQwen3.5-27Bnone CobuddymediumFree AvailablevsMiMo-V2-Pronone CobuddymediumFree AvailablevsQwen3.5-35B-A3Bnone CobuddymediumFree AvailablevsQwen3.5 Plus 2026-04-20none Elephant AlphamediumvsGLM 5 Turbonone Kimi K2.5nonevsElephant Alphamedium Ling-2.6-flashnonevsElephant Alphamedium CobuddymediumFree AvailablevsGLM 4.7 Flashnone