AI BENCHY
比較する
❤️ Made by XCS
Your ad here

モデル名

MoonshotAI: Kimi K2.5

推論なし

ベンチマークは AI BENCHY テストスイートから次の日時に生成 : 2026/02/24

指標 MoonshotAI: Kimi K2.5
順位#24
企業MoonshotAI
Score 3.62
一貫性 8.84
結果あたりのコスト 0.2413
合計コスト $0.00725
正解テスト
試行ごとの合格率 30.8%
不安定なテスト 2
出力トークン 1,695
推論トークン 0
応答時間(平均)11378ms
応答時間(合計)11378ms
応答時間(最大)11378ms

カテゴリ内訳

カテゴリ 完全合格テスト Score 一貫性 試行ごとの合格率 不安定なテスト 推論スコア 応答時間(平均) コスト
反AIトリック 2.67 7.86 11.1% 1 - 11378ms $0.00121
データ解析と抽出 5.50 5.81 83.3% 1 - 0ms $0.00455
ドメイン特化 4.00 10.00 33.3% 0 - 0ms $0.00027
指示追従 5.00 9.99 50.0% 0 - 0ms $0.00035
Puzzle Solving 2.00 9.92 0.0% 0 - 0ms $0.00090

比較対象モデル

MoonshotAI: Kimi K2.5 と比較...

#23 · Z.ai

Z.ai: GLM 4.7 Flash

推論(medium)

Score: 3.69

一貫性: 6.15

試行ごとの合格率: 48.7%

不安定なテスト: 6

結果あたりのコスト: 0.2600

正解テスト:

合計コスト: $0.01041

比較する

#25 · X Ai

xAI: Grok 4.1 Fast

推論なし

Score: 3.15

一貫性: 9.24

試行ごとの合格率: 28.2%

不安定なテスト: 1

結果あたりのコスト: 0.1153

正解テスト:

合計コスト: $0.00346

比較する

#22 · Xiaomi

Xiaomi: MiMo-V2-Flash

推論(medium)

Score: 3.77

一貫性: 7.46

試行ごとの合格率: 43.6%

不安定なテスト: 4

結果あたりのコスト: 0.5072

正解テスト:

合計コスト: $0.02029

比較する

クイック比較

MoonshotAI: Kimi K2.5 と比較...