ナビゲーション
AI BENCHY
比較する チャート
❤️ Made by XCS
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: GPT-5 Mini vs Z.ai: GLM 4.7 Flash

比較する:

ベンチマークは AI BENCHY テストスイートから次の日時に生成: 2026-03-05

指標 OpenAI: GPT-5 Mini medium リリース: 2025-08-07 Z.ai: GLM 4.7 Flash none リリース: 2026-01-19
順位 #31 #47
平均スコア 6.1 3.9
正解テスト
一貫性 8.9 8.3
結果あたりのコスト 1.401 0.064
合計コスト $0.113 $0.003
試行ごとの合格率 62.2% 37.8%
不安定なテスト 2 3
common.totalAttempts 45 (15 x 3) 45 (15 x 3)
出力トークン 5,477 1,721
推論トークン 46,912 0
応答時間(平均) 25.92s 3.16s
応答時間(最大) 88.15s 7.05s
応答時間(合計) 388.79s 25.31s

スコア上位モデル

応答時間(平均)

スコア vs 総コスト

平均スコア vs 応答時間(平均)

カテゴリ内訳

反AIトリック スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 出力トークン 推論トークン
OpenAI: GPT-5 Mini 7.0 9.6 66.7% 0 16.45s 1,645 5,824
Z.ai: GLM 4.7 Flash 10.0 7.2 22.2% 1 6.59s 430 0
複合 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 出力トークン 推論トークン
OpenAI: GPT-5 Mini 10.0 10.0 100.0% 0 88.15s 754 11,520
Z.ai: GLM 4.7 Flash 10.0 10.0 0.0% 0 3.22s 704 0
データ解析と抽出 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 出力トークン 推論トークン
OpenAI: GPT-5 Mini 9.9 10.0 100.0% 0 12.58s 453 3,200
Z.ai: GLM 4.7 Flash 5.4 5.8 83.3% 1 4.82s 196 0
ドメイン特化 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 出力トークン 推論トークン
OpenAI: GPT-5 Mini 10.0 7.2 22.2% 1 44.63s 293 14,016
Z.ai: GLM 4.7 Flash 7.0 10.0 66.7% 0 744ms 19 0
指示追従 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 出力トークン 推論トークン
OpenAI: GPT-5 Mini 7.5 6.6 83.3% 1 15.66s 318 4,992
Z.ai: GLM 4.7 Flash 5.5 10.0 50.0% 0 888ms 62 0
Puzzle Solving スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 出力トークン 推論トークン
OpenAI: GPT-5 Mini 4.3 9.8 33.3% 0 14.09s 1,527 5,760
Z.ai: GLM 4.7 Flash 3.7 10.0 0.0% 0 1.00s 98 0
ツール呼び出し スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 出力トークン 推論トークン
OpenAI: GPT-5 Mini 10.0 10.0 100.0% 0 18.64s 487 1,600
Z.ai: GLM 4.7 Flash 10.0 1.6 33.3% 1 7.05s 212 0

クイック比較

比較ペアを切り替え