AI BENCHY
比較する
❤️ Made by XCS

モデル名

Z.ai: GLM 4.7 Flash

ベンチマークは Aibenchy テストスイートから次の日時に生成 : 2026/02/19

指標 Z.ai: GLM 4.7 Flash
順位#20
企業Z.ai
Score 3.92
一貫性 6.51
結果あたりのコスト 0.2253
合計コスト $0.00902
正解テスト 4/12
試行ごとの合格率 50.0%
不安定なテスト 5
出力トークン 7,601
推論トークン 18,390

カテゴリ内訳

カテゴリ 完全合格テスト Score 一貫性 試行ごとの合格率 不安定なテスト 推論スコア コスト
Anti-AI Tricks 1/2 5.50 5.81 66.7% 1 9.08 $0.00131
Data parsing and extraction 2/2 10.00 10.00 100.0% 0 9.87 $0.00281
Domain specific 0/3 1.00 4.41 33.3% 2 8.21 $0.00183
Instructions following 1/2 5.00 5.81 66.7% 1 9.50 $0.00105
Puzzle Solving 0/3 1.00 7.20 11.1% 1 7.33 $0.00203

比較対象モデル

Z.ai: GLM 4.7 Flash と比較...

#19 · OpenAI

OpenAI: GPT-4o-mini

推論なし

Score: 4.00

一貫性: 9.98

試行ごとの合格率: 25.0%

不安定なテスト: 0

結果あたりのコスト: 0.0576

正解テスト: 3/12

合計コスト: $0.00173

比較する

#21 · Xiaomi

Xiaomi: MiMo-V2-Flash

推論(medium)

Score: 3.92

一貫性: 7.89

試行ごとの合格率: 44.4%

不安定なテスト: 3

結果あたりのコスト: 0.4829

正解テスト: 4/12

合計コスト: $0.01932

比較する

#18 · Stepfun

StepFun: Step 3.5 Flash

推論(medium)

Score: 4.92

一貫性: 7.34

試行ごとの合格率: 58.3%

不安定なテスト: 4

結果あたりのコスト: 0.0000

正解テスト: 5/12

合計コスト: $0.00000

比較する

クイック比較

Z.ai: GLM 4.7 Flash と比較...