AI BENCHY
比较
❤️ Made by XCS
Your ad here

模型名称

MoonshotAI: Kimi K2.5

无推理

基准结果生成自 AI BENCHY 测试套件,时间: : 2026年2月24日

指标 MoonshotAI: Kimi K2.5
排名#24
公司MoonshotAI
Score 3.62
一致性 8.84
每个结果成本 0.2413
总成本 $0.00725
测试正确
尝试通过率 30.8%
不稳定测试 2
输出令牌 1,695
推理令牌 0
响应时间(平均)11378ms
响应时间(总计)11378ms
响应时间(最大)11378ms

类别细分

类别 完全通过的测试 Score 一致性 尝试通过率 不稳定测试 推理得分 响应时间(平均) 成本
反AI技巧 2.67 7.86 11.1% 1 - 11378ms $0.00121
数据解析与提取 5.50 5.81 83.3% 1 - 0ms $0.00455
领域专项 4.00 10.00 33.3% 0 - 0ms $0.00027
指令遵循 5.00 9.99 50.0% 0 - 0ms $0.00035
Puzzle Solving 2.00 9.92 0.0% 0 - 0ms $0.00090

已对比模型

将 MoonshotAI: Kimi K2.5 与...对比

#23 · Z.ai

Z.ai: GLM 4.7 Flash

推理(medium)

Score: 3.69

一致性: 6.15

尝试通过率: 48.7%

不稳定测试: 6

每个结果成本: 0.2600

测试正确:

总成本: $0.01041

比较

#25 · X Ai

xAI: Grok 4.1 Fast

无推理

Score: 3.15

一致性: 9.24

尝试通过率: 28.2%

不稳定测试: 1

每个结果成本: 0.1153

测试正确:

总成本: $0.00346

比较

#22 · Xiaomi

Xiaomi: MiMo-V2-Flash

推理(medium)

Score: 3.77

一致性: 7.46

尝试通过率: 43.6%

不稳定测试: 4

每个结果成本: 0.5072

测试正确:

总成本: $0.02029

比较

快速对比

将 MoonshotAI: Kimi K2.5 与...对比