AI BENCHY Compare

Cobuddy vs Owl Alpha

Last updated at: 2026-05-06

Metric	Cobuddy Cobuddy medium Release: 2026-05-06 Free Available	Owl Alpha Owl Alpha none Release: 2026-04-30

Metric	Cobuddy Cobuddy medium Release: 2026-05-06 Free Available	Owl Alpha Owl Alpha none Release: 2026-04-30
Score	6.0	6.0
Rank	#90	#89
Reliability	9.9	10.0
Consistency	6.7	9.1
Tests Correct
Attempt pass rate	57.4%	46.3%
Flaky tests	7	2
Total Runs	54	54
Cost per result	0.000	0.000
Total Cost	$0.000	$0.000
Input Price	$0.000 / 1M	$0.000 / 1M
Output Price	$0.000 / 1M	$0.000 / 1M
Output Tokens	1,639	1,671
Reasoning Tokens	89,199	0
Response Time (avg)	36.47s	7.07s
Response Time (max)	309.02s	32.27s
Response Time (total)	656.47s	127.23s

Top Models by Score

Score vs Total Cost

Response Time (avg)

Score vs Response Time (avg)

Total Output Tokens

Score vs Total Output Tokens

Category Breakdown

Anti-AI Tricks	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Cobuddy	8.7	7.9	91.7%	1		10.00s	98	4,666
Owl Alpha	3.4	7.9	16.7%	1		2.78s	57	0

Coding	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Cobuddy	4.3	1.1	66.7%	1		53.59s	343	9,678
Owl Alpha	10.0	10.0	100.0%	0		32.27s	450	0

Combined	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Cobuddy	3.0	10.0	0.0%	0		47.38s	465	7,265
Owl Alpha	3.0	10.0	0.0%	0		21.74s	315	0

Data parsing and extraction	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Cobuddy	6.3	5.8	66.7%	1		17.36s	275	5,591
Owl Alpha	10.0	10.0	100.0%	0		3.60s	246	0

Domain specific	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Cobuddy	2.9	4.4	22.2%	2		128.15s	10	49,454
Owl Alpha	5.3	10.0	33.3%	0		3.00s	27	0

General Intelligence	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Cobuddy	4.2	9.9	0.0%	0		23.23s	76	3,782
Owl Alpha	4.3	10.0	0.0%	0		4.61s	80	0

Instructions following	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Cobuddy	9.8	10.0	100.0%	0		11.60s	64	2,842
Owl Alpha	6.4	10.0	50.0%	0		2.63s	63	0

Puzzle Solving	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Cobuddy	3.5	4.4	33.3%	2		12.91s	175	5,627
Owl Alpha	5.9	7.2	55.6%	1		4.43s	202	0

Tool Calling	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Output Tokens	Reasoning Tokens
Cobuddy	10.0	10.0	100.0%	0		11.19s	133	294
Owl Alpha	10.0	10.0	100.0%	0		22.78s	231	0

Quick Compare

Switch Comparison Pair

CobuddymediumFree AvailablevsMiMo-V2-Pronone CobuddymediumFree AvailablevsGLM 4.7 Flashnone CobuddymediumFree AvailablevsQwen3.5-27Bnone CobuddymediumFree AvailablevsGPT-5.4none CobuddymediumFree AvailablevsQwen3.6 27Bnone CobuddymediumFree AvailablevsQwen3.5-35B-A3Bnone CobuddymediumFree AvailablevsKimi K2.6none CobuddymediumFree AvailablevsGLM 5.1none gpt-oss-120bmediumFree AvailablevsOwl Alphanone CobuddymediumFree AvailablevsQwen3.5 Plus 2026-04-20none CobuddymediumFree AvailablevsDeepSeek V3.2none Owl AlphanonevsLaguna Xs.2mediumFree Available