AI BENCHY
比較する
❤️ Made by XCS

モデル名

OpenAI: GPT-4o-mini

ベンチマークは Aibenchy テストスイートから次の日時に生成 : 2026/02/19

指標 OpenAI: GPT-4o-mini
順位#19
企業OpenAI
Score 4.00
一貫性 9.98
結果あたりのコスト 0.0576
合計コスト $0.00173
正解テスト 3/12
試行ごとの合格率 25.0%
不安定なテスト 0
出力トークン 570
推論トークン 0

カテゴリ内訳

カテゴリ 完全合格テスト Score 一貫性 試行ごとの合格率 不安定なテスト 推論スコア コスト
Anti-AI Tricks 0/2 1.00 10.00 0.0% 0 - $0.00005
Data parsing and extraction 2/2 10.00 10.00 100.0% 0 - $0.00115
Domain specific 0/3 1.00 10.00 0.0% 0 - $0.00012
Instructions following 1/2 5.50 10.00 50.0% 0 - $0.00015
Puzzle Solving 0/3 4.00 9.92 0.0% 0 - $0.00028

比較対象モデル

OpenAI: GPT-4o-mini と比較...

#18 · Stepfun

StepFun: Step 3.5 Flash

推論(medium)

Score: 4.92

一貫性: 7.34

試行ごとの合格率: 58.3%

不安定なテスト: 4

結果あたりのコスト: 0.0000

正解テスト: 5/12

合計コスト: $0.00000

比較する

#20 · Z.ai

Z.ai: GLM 4.7 Flash

推論(medium)

Score: 3.92

一貫性: 6.51

試行ごとの合格率: 50.0%

不安定なテスト: 5

結果あたりのコスト: 0.2253

正解テスト: 4/12

合計コスト: $0.00902

比較する

#17 · MiniMax

MiniMax: MiniMax M2.5

推論(medium)

Score: 5.08

一貫性: 6.00

試行ごとの合格率: 61.1%

不安定なテスト: 6

結果あたりのコスト: 4.0276

正解テスト: 5/12

合計コスト: $0.20138

比較する

クイック比較

OpenAI: GPT-4o-mini と比較...