Compare Charts

Language:

❤️ Made by XCS

AI BENCHY Compare

LiquidAI: LFM2-24B-A2B vs MoonshotAI: Kimi K2.5

Model Name:

Last updated at : 2026-02-27 15:16

Summary

Metric	LiquidAI: LFM2-24B-A2B none Release: Unknown release date	MoonshotAI: Kimi K2.5 medium Release: Unknown release date
Rank	#39	#17
Score	2.43	6.29
Consistency	8.91	7.69
Cost per result	0.045	2.335
Total Cost	$0.001	$0.187
Tests Correct
Wrong Tests	13	6
Attempt pass rate	16.7%	73.8%
Flaky tests	2	4
Output Tokens	1,125	30,504
Reasoning Tokens	0	58,467

Category Breakdown

Anti-AI Tricks	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Output Tokens	Reasoning Tokens
LiquidAI: LFM2-24B-A2B	1.00	9.81	0.0%	0		490	0
MoonshotAI: Kimi K2.5	7.00	7.21	88.9%	1		335	6,255

Data parsing and extraction	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Output Tokens	Reasoning Tokens
LiquidAI: LFM2-24B-A2B	1.00	10.00	0.0%	0		219	0
MoonshotAI: Kimi K2.5	10.00	10.00	100.0%	0		1,181	6,049

Domain specific	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Output Tokens	Reasoning Tokens
LiquidAI: LFM2-24B-A2B	4.00	7.21	55.6%	1		30	0
MoonshotAI: Kimi K2.5	1.00	4.41	33.3%	2		20,696	30,894

Instructions following	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Output Tokens	Reasoning Tokens
LiquidAI: LFM2-24B-A2B	3.00	10.00	0.0%	0		60	0
MoonshotAI: Kimi K2.5	9.50	10.00	100.0%	0		3,777	4,967

Puzzle Solving	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Output Tokens	Reasoning Tokens
LiquidAI: LFM2-24B-A2B	3.33	7.88	22.2%	1		326	0
MoonshotAI: Kimi K2.5	5.00	7.61	55.6%	1		4,273	9,490

Tool Calling	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Output Tokens	Reasoning Tokens
LiquidAI: LFM2-24B-A2B	1.00	10.00	0.0%	0		0	0
MoonshotAI: Kimi K2.5	10.00	10.00	100.0%	0		242	812

Switch Comparison Pair

Compare LiquidAI: LFM2-24B-A2B against...

Compare MoonshotAI: Kimi K2.5 against...