Granite 4.1 8B vs Grok 4.20

順位: #224
合計出力トークン: 5,996
応答時間（平均）: 1.45s
合計コスト: $0.007

順位: #220
合計出力トークン: 1,923
応答時間（平均）: 1.11s
合計コスト: $0.057

おすすめモデル Grok 4.20

この比較で最も高いスコア（4.1）を出し、全 2 モデルの中でコストと応答時間のバランスも最良です。

詳細比較

指標	Granite 4.1 8B Granite 4.1 8B none リリース: 2026-05-01	Grok 4.20 Grok 4.20 none リリース: 2026-03-31

指標	Granite 4.1 8B Granite 4.1 8B none リリース: 2026-05-01	Grok 4.20 Grok 4.20 none リリース: 2026-03-31
スコア	4.0	4.1
順位	#224	#220
信頼性	10.0	該当なし
一貫性	10.0	8.1
正解テスト
試行ごとの合格率	9.1%	27.3%
不安定なテスト	0	0
総実行回数	66	54
結果あたりのコスト	0.315	1.570
合計コスト	$0.007	$0.057
入力価格	$0.050 / 1M	$1.250 / 1M
出力価格	$0.100 / 1M	$2.500 / 1M
合計入力トークン	113,827	41,313
出力トークン	5,996	1,923
推論トークン	0	0
応答時間（平均）	1.45s	1.11s
応答時間（最大）	16.67s	6.04s
応答時間（合計）	31.96s	19.96s

モデル生成ショーケース

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#224 IBM: Granite 4.1 8B

none

コスト: $0.001
時間: 3.2s
トークン: 491 tok

#220 xAI: Grok 4.20

none

コスト: $0.004
時間: 6.5s
トークン: 1,367 tok

スコア上位モデル

スコア vs 総コスト

応答時間（平均）

スコア vs 応答時間（平均）

合計出力トークン

スコア vs 合計出力トークン

カテゴリ内訳

カテゴリ:

反AIトリック	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Granite 4.1 8B	4.9	10.0	25.0%	0		844ms	645	903	0
Grok 4.20	4.8	10.0	25.0%	0		501ms	1,986	267	0

コーディング	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Granite 4.1 8B	4.5	10.0	0.0%	0		775ms	8,344	525	0
Grok 4.20	1.1	3.1	0.0%	0		1.22s	1,074	312	0

複合	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Granite 4.1 8B	3.0	10.0	0.0%	0		9.28s	86,631	3,481	0
Grok 4.20	1.5	5.0	0.0%	0		6.04s	17,673	282	0

データ解析と抽出	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Granite 4.1 8B	3.0	10.0	0.0%	0		575ms	7,617	195	0
Grok 4.20	10.0	10.0	100.0%	0		522ms	7,749	207	0

ドメイン特化	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Granite 4.1 8B	3.0	10.0	0.0%	0		357ms	768	24	0
Grok 4.20	3.0	10.0	0.0%	0		687ms	1,746	325	0

汎用知能	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Granite 4.1 8B	4.0	10.0	0.0%	0		499ms	528	115	0
Grok 4.20	4.8	10.0	0.0%	0		659ms	819	83	0

指示追従	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Granite 4.1 8B	3.6	9.9	0.0%	0		344ms	687	66	0
Grok 4.20	6.3	10.0	50.0%	0		445ms	1,350	60	0

パズル解決	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Granite 4.1 8B	3.2	10.0	0.0%	0		608ms	672	432	0
Grok 4.20	5.3	10.0	33.3%	0		473ms	1,671	198	0

ツール呼び出し	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Granite 4.1 8B	10.0	10.0	100.0%	0		2.17s	7,719	243	0
Grok 4.20	10.0	10.0	100.0%	0		4.63s	7,245	189	0

雑学	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Granite 4.1 8B	3.0	10.0	0.0%	0		306ms	216	12	0
Grok 4.20	0.0	0.0	0.0%	0		0ms	0	0	0

クイック比較

比較ペアを切り替え

Grok 4.20nonevsGLM 4.7 Flashmedium Granite 4.1 8BnonevsQwen3.5-9Bmedium Granite 4.1 8BnonevsGLM 4.7 Flashmedium Qwen3.5-9BmediumvsGrok 4.20none MiniMax M2.5mediumvsGrok 4.20none CobuddymediumvsGrok 4.20none Qwen3 Coder NextmediumvsGrok 4.20none Granite 4.1 8BnonevsMiniMax M2.5medium Trinity Large ThinkinghighvsGrok 4.20none CobuddymediumvsGranite 4.1 8Bnone Granite 4.1 8BnonevsQwen3 Coder Nextmedium Trinity Large ThinkinghighvsGranite 4.1 8Bnone