AI BENCHY
比較する
❤️ Made by XCS

モデル名

xAI: Grok 4.1 Fast

ベンチマークは Aibenchy テストスイートから次の日時に生成 : 2026/02/19

指標 xAI: Grok 4.1 Fast
順位#8
企業X Ai
Score 6.42
一貫性 8.60
結果あたりのコスト 0.4800
合計コスト $0.03360
正解テスト 7/12
試行ごとの合格率 66.7%
不安定なテスト 2
出力トークン 437
推論トークン 61,090

カテゴリ内訳

カテゴリ 完全合格テスト Score 一貫性 試行ごとの合格率 不安定なテスト 推論スコア コスト
Anti-AI Tricks 2/2 10.00 10.00 100.0% 0 4.00 $0.00151
Data parsing and extraction 2/2 10.00 10.00 100.0% 0 9.00 $0.00438
Domain specific 1/3 4.00 7.21 55.6% 1 5.00 $0.02064
Instructions following 1/2 5.50 10.00 50.0% 0 3.25 $0.00191
Puzzle Solving 1/3 4.67 7.20 44.4% 1 8.50 $0.00518

比較対象モデル

xAI: Grok 4.1 Fast と比較...

#7 · Z.ai

Z.ai: GLM 5

推論(medium)

Score: 6.83

一貫性: 7.86

試行ごとの合格率: 80.6%

不安定なテスト: 3

結果あたりのコスト: 1.3424

正解テスト: 8/12

合計コスト: $0.10740

比較する

#9 · MoonshotAI

MoonshotAI: Kimi K2.5

推論(medium)

Score: 6.42

一貫性: 8.00

試行ごとの合格率: 72.2%

不安定なテスト: 3

結果あたりのコスト: 2.4097

正解テスト: 7/12

合計コスト: $0.16868

比較する

#6 · Anthropic

Anthropic: Claude Sonnet 4.6

推論(medium)

Score: 7.00

一貫性: 9.30

試行ごとの合格率: 69.4%

不安定なテスト: 1

結果あたりのコスト: 9.3797

正解テスト: 8/12

合計コスト: $0.75038

比較する

クイック比較

xAI: Grok 4.1 Fast と比較...