AI BENCHY Compare

Google: Gemini 2.5 Flash vs MoonshotAI: Kimi K2.6

Summary

Gemini 2.5 Flash vs Kimi K2.6 benchmark comparison: Gemini 2.5 Flash leads on average score with 6.2 vs 5.8. Gemini 2.5 Flash has the lower benchmark cost at $0.016 vs $0.079. Gemini 2.5 Flash is faster at 875ms vs 13.27s, with pass rates of 46.0% vs 36.5%.

Recommended model: Gemini 2.5 Flash - It has the best score here (6.2), while costing about 5.2x less than Kimi K2.6.

Last updated at: 2026-06-18

Metric	Gemini 2.5 Flash Gemini 2.5 Flash none Release: 2025-06-17	Kimi K2.6 Kimi K2.6 none Release: 2026-04-20 Free Available

Metric	Gemini 2.5 Flash Gemini 2.5 Flash none Release: 2025-06-17	Kimi K2.6 Kimi K2.6 none Release: 2026-04-20 Free Available
Score	6.2	5.8
Rank	#93	#111
Reliability	10.0	10.0
Consistency	9.6	9.2
Tests Correct
Attempt pass rate	46.0%	36.5%
Flaky tests	1	2
Total Runs	63	63
Cost per result	0.169	1.267
Total Cost	$0.016	$0.079
Input Price	$0.300 / 1M	$0.680 / 1M
Output Price	$2.500 / 1M	$3.410 / 1M
Total Input Tokens	35,926	32,916
Output Tokens	1,770	16,410
Reasoning Tokens	0	0
Response Time (avg)	875ms	13.27s
Response Time (max)	4.39s	238.89s
Response Time (total)	18.37s	278.57s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#93 Gemini 2.5 Flash

none

Invalid SVG

Cost: $0.164
Time: 215.5s
Tokens: 65,659 tok

#111 MoonshotAI: Kimi K2.6

none

Cost: $0.020
Time: 127.4s
Tokens: 4,429 tok

Top Models by Score

Score vs Total Cost

Response Time (avg)

Score vs Response Time (avg)

Total Output Tokens

Score vs Total Output Tokens

Category Breakdown

Anti-AI Tricks	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 2.5 Flash	3.0	10.0	0.0%	0		582ms	492	102	0
Kimi K2.6	4.6	10.0	25.0%	0		1.39s	618	471	0

Coding	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 2.5 Flash	5.5	10.0	33.3%	0		736ms	8,122	483	0
Kimi K2.6	5.5	9.8	33.3%	0		82.57s	5,986	14,754	0

Combined	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 2.5 Flash	3.0	10.0	0.0%	0		4.39s	12,519	366	0
Kimi K2.6	3.0	10.0	0.0%	0		3.38s	11,269	290	0

Data parsing and extraction	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 2.5 Flash	10.0	10.0	100.0%	0		652ms	7,257	279	0
Kimi K2.6	10.0	10.0	100.0%	0		1.32s	7,014	201	0

Domain specific	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 2.5 Flash	5.9	7.2	55.6%	1		495ms	633	12	0
Kimi K2.6	5.3	7.2	44.4%	1		1.48s	732	42	0

General Intelligence	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 2.5 Flash	5.0	10.0	0.0%	0		615ms	486	78	0
Kimi K2.6	5.4	3.5	33.3%	1		1.55s	477	138	0

Instructions following	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 2.5 Flash	10.0	10.0	100.0%	0		590ms	615	72	0
Kimi K2.6	6.5	10.0	50.0%	0		1.64s	669	72	0

Puzzle Solving	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 2.5 Flash	7.7	10.0	66.7%	0		604ms	558	132	0
Kimi K2.6	3.1	9.9	0.0%	0		1.40s	651	185	0

Tool Calling	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 2.5 Flash	10.0	10.0	100.0%	0		1.91s	5,088	234	0
Kimi K2.6	10.0	10.0	100.0%	0		4.46s	5,286	240	0

Trivia	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Response Time (avg)	Input Tokens	Output Tokens	Reasoning Tokens
Gemini 2.5 Flash	3.0	10.0	0.0%	0		1.15s	156	12	0
Kimi K2.6	3.0	10.0	0.0%	0		1.36s	214	17	0

Quick Compare

Switch Comparison Pair

North Mini CodemediumFree AvailablevsKimi K2.6noneFree Available Gemini 2.5 FlashnonevsQwen3.5-35B-A3Bmedium Gemini 2.5 FlashnonevsNemotron 3 SupermediumFree Available North Mini CodemediumFree AvailablevsGemini 2.5 Flashnone Gemini 3.1 Flash LiteminimalvsKimi K2.6noneFree Available Gemini 2.5 FlashnonevsQwen3.6 27Bmedium Gemini 2.5 FlashnonevsStep 3.5 Flashmedium Kimi K2.6noneFree AvailablevsQwen3.5-35B-A3Bmedium Gemini 2.5 FlashnonevsGPT-5 Nanomedium Gemma 4 31BmediumFree AvailablevsKimi K2.6noneFree Available Kimi K2.6noneFree AvailablevsNemotron 3 SupermediumFree Available Gemini 2.5 Flashnonevsgpt-oss-120bmediumFree Available