AI BENCHY Compare

Cobuddy vs Elephant Alpha

Last updated at: 2026-05-19

Metric	Cobuddy Cobuddy medium Release: 2026-05-06 Free Available	Elephant Alpha Elephant Alpha none Release: 2026-04-14

Metric	Cobuddy Cobuddy medium Release: 2026-05-06 Free Available	Elephant Alpha Elephant Alpha none Release: 2026-04-14
Score	5.8	5.3
Rank	#102	#123
Reliability	9.9	N/A
Consistency	6.9	9.6
Tests Correct
Attempt pass rate	54.4%	31.5%
Flaky tests	7	1
Total Runs	57	57
Cost per result	0.000	0.000
Total Cost	$0.000	$0.000
Input Price	$0.000 / 1M	$0.000 / 1M
Output Price	$0.000 / 1M	$0.000 / 1M
Output Tokens	1,648	2,573
Reasoning Tokens	96,062	0
Response Time (avg)	36.50s	1.23s
Response Time (max)	309.02s	3.81s
Response Time (total)	693.45s	22.16s

Top Models by Score

Score vs Total Cost

Response Time (avg)

Score vs Response Time (avg)

Total Output Tokens

Score vs Total Output Tokens

Category Breakdown

Anti-AI Tricks	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Cobuddy	8.7	7.9	91.7%	1		10.00s	98	4,666
Elephant Alpha	6.6	10.0	50.0%	0		963ms	610	0

Coding	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Cobuddy	4.3	1.1	66.7%	1		53.59s	343	9,678
Elephant Alpha	6.4	3.3	66.7%	1		1.39s	375	0

Combined	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Cobuddy	3.0	10.0	0.0%	0		47.38s	465	7,265
Elephant Alpha	3.0	10.0	0.0%	0		3.81s	731	0

Data parsing and extraction	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Cobuddy	6.3	5.8	66.7%	1		17.36s	275	5,591
Elephant Alpha	6.5	10.0	50.0%	0		1.04s	246	0

Domain specific	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Cobuddy	2.9	4.4	22.2%	2		128.15s	10	49,454
Elephant Alpha	3.0	10.0	0.0%	0		927ms	24	0

General Intelligence	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Cobuddy	4.2	9.9	0.0%	0		23.23s	76	3,782
Elephant Alpha	4.0	10.0	0.0%	0		854ms	106	0

Instructions following	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Cobuddy	9.8	10.0	100.0%	0		11.60s	64	2,842
Elephant Alpha	9.8	10.0	100.0%	0		1.03s	81	0

Puzzle Solving	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Cobuddy	3.5	4.4	33.3%	2		12.91s	175	5,627
Elephant Alpha	4.0	10.0	0.0%	0		849ms	170	0

Tool Calling	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Cobuddy	10.0	10.0	100.0%	0		11.19s	133	294
Elephant Alpha	3.0	10.0	0.0%	0		2.79s	230	0

Trivia	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Cobuddy	3.0	10.0	0.0%	0		36.98s	9	6,863
Elephant Alpha	0.0	0.0	0.0%	0		0ms	0	0

Quick Compare

Switch Comparison Pair

CobuddymediumFree AvailablevsQwen3.6 27Bnone CobuddymediumFree AvailablevsOwl Alphanone CobuddymediumFree AvailablevsQwen3.5-27Bnone CobuddymediumFree AvailablevsMiMo-V2-Pronone CobuddymediumFree AvailablevsGLM 4.7 Flashnone CobuddymediumFree AvailablevsQwen3.5-35B-A3Bnone CobuddymediumFree AvailablevsGPT-5.4none CobuddymediumFree AvailablevsQwen3.5 Plus 2026-04-20none CobuddymediumFree AvailablevsKimi K2.6none CobuddymediumFree AvailablevsGLM 5.1none CobuddymediumFree AvailablevsMiMo-V2.5-Pronone CobuddymediumFree AvailablevsQwen3.5-Flashnone