AI BENCHY Compare

IBM: Granite 4.1 8B vs OpenAI: GPT-5.4 Nano

ベンチマークは AI BENCHY テストスイートから次の日時に生成: 2026-05-01

指標	Granite 4.1 8B Granite 4.1 8B none リリース: 2026-05-01	GPT-5.4 Nano GPT-5.4 Nano none リリース: 2026-03-17

指標	Granite 4.1 8B Granite 4.1 8B none リリース: 2026-05-01	GPT-5.4 Nano GPT-5.4 Nano none リリース: 2026-03-17
スコア	4.3	4.6
順位	#135	#127
信頼性	10.0	該当なし
一貫性	10.0	7.4
正解テスト
試行ごとの合格率	11.1%	33.3%
不安定なテスト	0	6
総実行回数	54	54
結果あたりのコスト	0.110	0.299
合計コスト	$0.003	$0.009
????	$0.050 / 1M	$0.200 / 1M
????	$0.100 / 1M	$1.250 / 1M
出力トークン	2,712	2,762
推論トークン	0	0
応答時間（平均）	767ms	1.40s
応答時間（最大）	2.17s	3.84s
応答時間（合計）	13.81s	25.14s

スコア上位モデル

スコア vs 総コスト

応答時間（平均）

スコア vs 応答時間（平均）

合計出力トークン

スコア vs 合計出力トークン

カテゴリ内訳

反AIトリック	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
Granite 4.1 8B	4.9	10.0	25.0%	0		844ms	903	0
GPT-5.4 Nano	3.5	8.0	16.7%	1		1.18s	800	0

コーディング	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
Granite 4.1 8B	6.9	10.0	0.0%	0		1.07s	339	0
GPT-5.4 Nano	7.1	3.7	66.7%	1		1.43s	577	0

複合	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
Granite 4.1 8B	3.0	10.0	0.0%	0		1.88s	396	0
GPT-5.4 Nano	3.0	10.0	0.0%	0		3.84s	280	0

データ解析と抽出	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
Granite 4.1 8B	3.0	10.0	0.0%	0		575ms	195	0
GPT-5.4 Nano	6.5	10.0	50.0%	0		1.11s	219	0

ドメイン特化	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
Granite 4.1 8B	3.0	10.0	0.0%	0		357ms	24	0
GPT-5.4 Nano	2.9	4.4	22.2%	2		926ms	52	0

汎用知能	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
Granite 4.1 8B	4.0	10.0	0.0%	0		499ms	115	0
GPT-5.4 Nano	3.8	2.5	33.3%	1		1.31s	180	0

指示追従	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
Granite 4.1 8B	3.6	9.9	0.0%	0		344ms	66	0
GPT-5.4 Nano	6.3	10.0	50.0%	0		787ms	84	0

パズル解決	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
Granite 4.1 8B	3.7	10.0	0.0%	0		635ms	431	0
GPT-5.4 Nano	3.7	7.3	22.2%	1		1.29s	348	0

ツール呼び出し	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
Granite 4.1 8B	10.0	10.0	100.0%	0		2.17s	243	0
GPT-5.4 Nano	10.0	10.0	100.0%	0		3.40s	222	0

クイック比較

比較ペアを切り替え

GPT-5.4 NanononevsGLM 4.7 Flashmedium Granite 4.1 8BnonevsQwen3.5-9Bmedium GPT-5.4 NanononevsQwen3.5-9Bmedium GPT-5.4 NanononevsQwen3 Coder Nextmedium Granite 4.1 8BnonevsGLM 4.7 Flashmedium Nemotron 3 Nano Omni 30b A3b Reasoningmedium無料で利用可能vsGPT-5.4 Nanonone GPT-5.4 NanononevsElephant Alphamedium Granite 4.1 8BnonevsQwen3 Coder Nextmedium MiniMax M2.7mediumvsGPT-5.4 Nanonone Granite 4.1 8BnonevsNemotron 3 Nano Omni 30b A3b Reasoningmedium無料で利用可能 Granite 4.1 8BnonevsElephant Alphamedium Granite 4.1 8BnonevsMiniMax M2.7medium