AI BENCHY Compare

MoonshotAI: Kimi K2.6 vs Elephant Alpha

Last updated at: 2026-06-04

Metric	Kimi K2.6 Kimi K2.6 none Release: 2026-04-20 Free Available	Elephant Alpha Elephant Alpha medium Release: 2026-04-14

Metric	Kimi K2.6 Kimi K2.6 none Release: 2026-04-20 Free Available	Elephant Alpha Elephant Alpha medium Release: 2026-04-14
Score	5.5	5.1
Rank	#124	#136
Reliability	10.0	N/A
Consistency	9.2	9.7
Tests Correct
Attempt pass rate	36.5%	30.2%
Flaky tests	2	1
Total Runs	63	63
Cost per result	1.267	0.000
Total Cost	$0.079	$0.000
Input Price	$0.684 / 1M	$0.000 / 1M
Output Price	$3.420 / 1M	$0.000 / 1M
Total Input Tokens	32,916	33,744
Output Tokens	16,410	2,596
Reasoning Tokens	0	0
Response Time (avg)	13.27s	1.27s
Response Time (max)	238.89s	3.70s
Response Time (total)	278.57s	22.82s

Top Models by Score

Score vs Total Cost

Response Time (avg)

Score vs Response Time (avg)

Total Output Tokens

Score vs Total Output Tokens

Category Breakdown

Anti-AI Tricks	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Kimi K2.6	4.6	10.0	25.0%	0		1.39s	618	471	0
Elephant Alpha	6.6	10.0	50.0%	0		1.19s	726	815	0

Coding	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Kimi K2.6	5.5	9.8	33.3%	0		82.57s	5,986	14,754	0
Elephant Alpha	3.7	7.8	11.1%	1		1.30s	813	365	0

Combined	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Kimi K2.6	3.0	10.0	0.0%	0		3.38s	11,269	290	0
Elephant Alpha	3.0	10.0	0.0%	0		3.70s	14,046	562	0

Data parsing and extraction	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Kimi K2.6	10.0	10.0	100.0%	0		1.32s	7,014	201	0
Elephant Alpha	6.5	10.0	50.0%	0		979ms	8,004	246	0

Domain specific	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Kimi K2.6	5.3	7.2	44.4%	1		1.48s	732	42	0
Elephant Alpha	3.0	10.0	0.0%	0		925ms	810	24	0

General Intelligence	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Kimi K2.6	5.4	3.5	33.3%	1		1.55s	477	138	0
Elephant Alpha	4.3	10.0	0.0%	0		920ms	540	105	0

Instructions following	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Kimi K2.6	6.5	10.0	50.0%	0		1.64s	669	72	0
Elephant Alpha	9.8	10.0	100.0%	0		987ms	732	82	0

Puzzle Solving	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Kimi K2.6	3.1	9.9	0.0%	0		1.40s	651	185	0
Elephant Alpha	5.3	10.0	33.3%	0		868ms	729	166	0

Tool Calling	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Kimi K2.6	10.0	10.0	100.0%	0		4.46s	5,286	240	0
Elephant Alpha	3.0	10.0	0.0%	0		2.83s	7,344	231	0

Trivia	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Kimi K2.6	3.0	10.0	0.0%	0		1.36s	214	17	0
Elephant Alpha	3.0	10.0	0.0%	0		0ms	0	0	0

Quick Compare

Switch Comparison Pair

Kimi K2.5nonevsElephant Alphamedium Ling-2.6-flashnonevsElephant Alphamedium Elephant AlphamediumvsGLM 5 Turbonone DeepSeek V3.2nonevsElephant Alphamedium MiniMax M2.5mediumvsKimi K2.6noneFree Available DeepSeek V4 FlashnonevsElephant Alphamedium CobuddymediumvsKimi K2.6noneFree Available MiniMax M2.7mediumvsKimi K2.6noneFree Available Elephant AlphamediumvsQwen3.5-122B-A10Bnone Mistral Small 4mediumvsKimi K2.6noneFree Available Elephant AlphamediumvsQwen3 Coder Nextnone Nemotron 3 SupernoneFree AvailablevsElephant Alphamedium