AI BENCHY
比較する
❤️ Made by XCS

モデル名

MiniMax: MiniMax M2.5

ベンチマークは Aibenchy テストスイートから次の日時に生成 : 2026/02/19

指標 MiniMax: MiniMax M2.5
順位#17
企業MiniMax
Score 5.08
一貫性 6.00
結果あたりのコスト 4.0276
合計コスト $0.20138
正解テスト 5/12
試行ごとの合格率 61.1%
不安定なテスト 6
出力トークン 121,028
推論トークン 165,110

カテゴリ内訳

カテゴリ 完全合格テスト Score 一貫性 試行ごとの合格率 不安定なテスト 推論スコア コスト
Anti-AI Tricks 2/2 10.00 10.00 100.0% 0 7.58 $0.00902
Data parsing and extraction 1/2 5.50 5.81 83.3% 1 9.45 $0.00774
Domain specific 0/3 1.00 4.41 22.2% 2 6.06 $0.16952
Instructions following 1/2 7.00 6.41 66.7% 1 8.33 $0.00307
Puzzle Solving 1/3 4.33 4.79 55.5% 2 8.28 $0.01205

比較対象モデル

MiniMax: MiniMax M2.5 と比較...

#16 · Anthropic

Anthropic: Claude Opus 4.6

推論(medium)

Score: 5.42

一貫性: 8.60

試行ごとの合格率: 55.5%

不安定なテスト: 2

結果あたりのコスト: 12.8695

正解テスト: 6/12

合計コスト: $0.77217

比較する

#18 · Stepfun

StepFun: Step 3.5 Flash

推論(medium)

Score: 4.92

一貫性: 7.34

試行ごとの合格率: 58.3%

不安定なテスト: 4

結果あたりのコスト: 0.0000

正解テスト: 5/12

合計コスト: $0.00000

比較する

#15 · Z.ai

Z.ai: GLM 5

推論なし

Score: 5.42

一貫性: 10.00

試行ごとの合格率: 50.0%

不安定なテスト: 0

結果あたりのコスト: 0.0704

正解テスト: 6/12

合計コスト: $0.00423

比較する

クイック比較

MiniMax: MiniMax M2.5 と比較...