AI BENCHY
比较
❤️ Made by XCS

模型名称

xAI: Grok 4.1 Fast

基准结果生成自 Aibenchy 测试套件,时间: : 2026年2月19日

指标 xAI: Grok 4.1 Fast
排名#24
公司X Ai
Score 3.25
一致性 9.17
每个结果成本 0.1074
总成本 $0.00323
测试正确 3/12
尝试通过率 30.6%
不稳定测试 1
输出令牌 500
推理令牌 0

类别细分

类别 完全通过的测试 Score 一致性 尝试通过率 不稳定测试 推理得分 成本
Anti-AI Tricks 0/2 1.00 10.00 0.0% 0 - $0.00026
Data parsing and extraction 2/2 10.00 10.00 100.0% 0 - $0.00166
Domain specific 1/3 4.00 7.21 55.6% 1 - $0.00044
Instructions following 0/2 1.00 10.00 0.0% 0 - $0.00036
Puzzle Solving 0/3 1.00 9.48 0.0% 0 - $0.00053

已对比模型

将 xAI: Grok 4.1 Fast 与...对比

#23 · Z.ai

Z.ai: GLM 4.7 Flash

无推理

Score: 3.25

一致性: 8.75

尝试通过率: 27.8%

不稳定测试: 2

每个结果成本: 0.0351

测试正确: 2/12

总成本: $0.00071

比较

#25 · Qwen

Qwen: Qwen3 Coder Next

推理(medium)

Score: 3.08

一致性: 8.80

尝试通过率: 22.2%

不稳定测试: 2

每个结果成本: 0.0944

测试正确: 2/12

总成本: $0.00189

比较

#22 · MoonshotAI

MoonshotAI: Kimi K2.5

无推理

Score: 3.42

一致性: 9.28

尝试通过率: 30.6%

不稳定测试: 1

每个结果成本: 0.2049

测试正确: 3/12

总成本: $0.00615

比较

快速对比

将 xAI: Grok 4.1 Fast 与...对比