Compare Charts

Language:

❤️ Made by XCS

AI BENCHY Compare

LiquidAI: LFM2-24B-A2B vs OpenAI: GPT-4o-mini

Model Name:

Last updated at : 2026-02-27 15:16

Summary

Metric	LiquidAI: LFM2-24B-A2B none Release: Unknown release date	OpenAI: GPT-4o-mini none Release: Unknown release date
Rank	#39	#28
Score	2.43	4.86
Consistency	8.91	9.98
Cost per result	0.045	0.056
Total Cost	$0.001	$0.003
Tests Correct
Wrong Tests	13	9
Attempt pass rate	16.7%	35.7%
Flaky tests	2	0
Output Tokens	1,125	949
Reasoning Tokens	0	0

Category Breakdown

Anti-AI Tricks	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Output Tokens	Reasoning Tokens
LiquidAI: LFM2-24B-A2B	1.00	9.81	0.0%	0		490	0
OpenAI: GPT-4o-mini	4.00	10.00	33.3%	0		180	0

Data parsing and extraction	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Output Tokens	Reasoning Tokens
LiquidAI: LFM2-24B-A2B	1.00	10.00	0.0%	0		219	0
OpenAI: GPT-4o-mini	10.00	10.00	100.0%	0		183	0

Domain specific	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Output Tokens	Reasoning Tokens
LiquidAI: LFM2-24B-A2B	4.00	7.21	55.6%	1		30	0
OpenAI: GPT-4o-mini	1.00	10.00	0.0%	0		15	0

Instructions following	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Output Tokens	Reasoning Tokens
LiquidAI: LFM2-24B-A2B	3.00	10.00	0.0%	0		60	0
OpenAI: GPT-4o-mini	5.50	10.00	50.0%	0		71	0

Puzzle Solving	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Output Tokens	Reasoning Tokens
LiquidAI: LFM2-24B-A2B	3.33	7.88	22.2%	1		326	0
OpenAI: GPT-4o-mini	4.00	9.92	0.0%	0		295	0

Tool Calling	Score	Consistency	Attempt pass rate	Flaky tests	Tests Correct	Output Tokens	Reasoning Tokens
LiquidAI: LFM2-24B-A2B	1.00	10.00	0.0%	0		0	0
OpenAI: GPT-4o-mini	10.00	10.00	100.0%	0		205	0

Switch Comparison Pair

Compare LiquidAI: LFM2-24B-A2B against...

Compare OpenAI: GPT-4o-mini against...