ナビゲーション
AI BENCHY
Advertise here

AI BENCHY Compare

IBM: Granite 4.1 8B vs Mistral: Mistral Small 4

ベンチマークは AI BENCHY テストスイートから次の日時に生成: 2026-05-29

指標 Granite 4.1 8B Granite 4.1 8B none リリース: 2026-05-01 Mistral Small 4 Mistral Small 4 none リリース: 2026-03-16
スコア 4.1 5.0
順位 #158 #140
信頼性 10.0 10.0
一貫性 10.0 9.5
正解テスト
試行ごとの合格率 10.0% 28.3%
不安定なテスト 0 1
総実行回数 60 60
結果あたりのコスト 0.122 0.131
合計コスト $0.003 $0.007
入力価格 $0.050 / 1M $0.150 / 1M
出力価格 $0.100 / 1M $0.600 / 1M
出力トークン 2,743 2,192
推論トークン 0 0
応答時間(平均) 719ms 629ms
応答時間(最大) 2.17s 1.72s
応答時間(合計) 14.37s 12.59s

スコア上位モデル

スコア vs 総コスト

応答時間(平均)

スコア vs 応答時間(平均)

合計出力トークン

スコア vs 合計出力トークン

カテゴリ内訳

反AIトリック スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 出力トークン 推論トークン
Granite 4.1 8B 4.9 10.0 25.0% 0 844ms 903 0
Mistral Small 4 3.4 7.9 16.7% 1 395ms 182 0
コーディング スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 出力トークン 推論トークン
Granite 4.1 8B 5.2 10.0 0.0% 0 706ms 357 0
Mistral Small 4 4.0 9.5 0.0% 0 1.03s 610 0
複合 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 出力トークン 推論トークン
Granite 4.1 8B 3.0 10.0 0.0% 0 1.88s 396 0
Mistral Small 4 3.0 10.0 0.0% 0 1.72s 496 0
データ解析と抽出 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 出力トークン 推論トークン
Granite 4.1 8B 3.0 10.0 0.0% 0 575ms 195 0
Mistral Small 4 10.0 10.0 100.0% 0 822ms 261 0
ドメイン特化 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 出力トークン 推論トークン
Granite 4.1 8B 3.0 10.0 0.0% 0 357ms 24 0
Mistral Small 4 5.3 10.0 33.3% 0 367ms 28 0
汎用知能 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 出力トークン 推論トークン
Granite 4.1 8B 4.0 10.0 0.0% 0 499ms 115 0
Mistral Small 4 4.0 10.0 0.0% 0 729ms 205 0
指示追従 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 出力トークン 推論トークン
Granite 4.1 8B 3.6 9.9 0.0% 0 344ms 66 0
Mistral Small 4 6.5 10.0 50.0% 0 380ms 69 0
パズル解決 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 出力トークン 推論トークン
Granite 4.1 8B 3.2 10.0 0.0% 0 608ms 432 0
Mistral Small 4 3.1 9.9 0.0% 0 399ms 111 0
ツール呼び出し スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 出力トークン 推論トークン
Granite 4.1 8B 10.0 10.0 100.0% 0 2.17s 243 0
Mistral Small 4 10.0 10.0 100.0% 0 1.40s 213 0
雑学 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 出力トークン 推論トークン
Granite 4.1 8B 3.0 10.0 0.0% 0 306ms 12 0
Mistral Small 4 3.0 10.0 0.0% 0 397ms 17 0

クイック比較

比較ペアを切り替え