#107

LFM2-24B-A2B

Liquid 发布日期: 2026-02-24 测试于: 2026-04-10 23:27 liquid/lfm-2-24b-a2b::none

摘要

LFM2-24B-A2B 在 AI BENCHY 上得分 4.1，排名 #107。它的可靠性为 不适用，通过率为 14.6%，总成本为 $0.001，平均响应时间为 811ms。

LFM2-24B-A2B 的独特之处：它最突出的是 领域专项，排名 #4；相对较弱的是 数据解析与提取，排名 #15。相比类似模型，它的速度明显更快。

已归档模型：该模型将不再更新，也不会在新测试中继续测试。

分数

4.1

一致性

9.0

可靠性

不适用

总成本（当前价格）

$0.001

总输出令牌

1,185

总输入令牌

输入价格

$0.030 / 1M

输出价格

$0.120 / 1M

测试正确

错误测试数: 15

尝试通过率: 14.6%

不稳定测试

不稳定测试在运行之间出现混合结果（至少一次通过且至少一次失败）。

响应时间（平均）

811ms

响应时间（最大）: 2.88s

响应时间（总计）: 11.35s

答案错误: 9 API 错误: 4 未遵循指令: 2

生成展示

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#107 LiquidAI: LFM2-24B-A2B

none

无效SVG

成本: $0.000
时间: 300.0s
令牌: 0 tok

测试历史

测试于	分数	可靠性	总成本	比较
2026-05-06 14:04 重新测试	4.2	不适用	$0.001	比较
2026-05-06 14:04 重新测试	4.2	不适用	$0.001	比较
2026-05-06 14:04 测试集已变更	4.2	不适用	$0.001	比较
2026-04-10 23:27 首次记录的运行	4.1	不适用	$0.001	当前轮次

轮次对比

测试轮次	分数	一致性	可靠性	测试正确	不稳定测试	总输出令牌	总成本	响应时间（平均）
2026-04-10 23:27 · 首次记录的运行	4.1	9.0	不适用	1/16	2	1,185	$0.001	811ms
2026-05-06 14:04 · 测试集已变更	4.2	9.0	不适用	2/16	2	1,185	$0.001	811ms
差值	-0.1	0.0		-1	0	0	$0.000	0ms

这两次运行使用了不同的基准测试集，因此差异同时反映模型变化和测试集变化。

图表

先选择第一个模型，再点击第二个模型打开并排页面。

按分数排名的模型

分数 vs 总成本

响应时间（平均）

分数 vs 响应时间（平均）

总输出令牌

分数 vs 总输出令牌

快速对比

LFM2-24B-A2BnonevsGemini 3.5 Flashhigh LFM2-24B-A2BnonevsGemini 3 Flash Previewmedium LFM2-24B-A2BnonevsNemotron 3 Ultra 550b A55bmedium免费可用 LFM2-24B-A2BnonevsGPT-5.5low

类别细分

类别	分数	一致性
反AI技巧	3.3	9.8
综合	3.0	10.0
数据解析与提取	3.0	10.0
领域专项	5.9	7.2
通用智能	4.0	10.0
指令遵循	4.8	10.0
谜题求解	4.4	7.9
工具调用	3.0	10.0

LFM2-24B-A2B

Hamster playing table tennis

#107 LiquidAI: LFM2-24B-A2B

图表

按分数排名的模型

分数 vs 总成本

响应时间（平均）

分数 vs 响应时间（平均）

总输出令牌

分数 vs 总输出令牌

快速对比

类别细分

已对比模型