Gemini 3 Flash Preview (low) vs Grok 4.20 (medium)

順位: #69
合計出力トークン: 38,090
応答時間（平均）: 6.28s
合計コスト: $0.177

順位: #83
合計出力トークン: 259,340
応答時間（平均）: 29.47s
合計コスト: $0.777

おすすめモデル Gemini 3 Flash Preview (low)

ここでは最高スコア（7.4）で、Grok 4.20 (medium) より約 4.4 倍低コストです。

詳細比較

指標	Gemini 3 Flash Preview Gemini 3 Flash Preview low リリース: 2025-12-17	Grok 4.20 Grok 4.20 medium リリース: 2026-03-31

指標	Gemini 3 Flash Preview Gemini 3 Flash Preview low リリース: 2025-12-17	Grok 4.20 Grok 4.20 medium リリース: 2026-03-31
スコア	7.4	7.1
順位	#69	#83
信頼性	10.0	10.0
一貫性	9.2	8.5
正解テスト
試行ごとの合格率	75.8%	63.6%
不安定なテスト	2	4
総実行回数	66	66
結果あたりのコスト	1.101	9.709
合計コスト	$0.177	$0.777
入力価格	$0.500 / 1M	$1.250 / 1M
出力価格	$3.000 / 1M	$2.500 / 1M
合計入力トークン	123,684	102,791
出力トークン	9,572	5,363
推論トークン	28,518	253,977
応答時間（平均）	6.28s	29.47s
応答時間（最大）	17.13s	199.66s
応答時間（合計）	138.06s	648.35s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#69 Gemini 3 Flash Preview

low

コスト: $0.007
時間: 12.1s
トークン: 2,289 tok

#83 xAI: Grok 4.20

medium

コスト: $0.041
時間: 110.3s
トークン: 16,336 tok

スコア上位モデル

スコア vs 総コスト

応答時間（平均）

スコア vs 応答時間（平均）

合計出力トークン

スコア vs 合計出力トークン

カテゴリ内訳

カテゴリ:

反AIトリック	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Gemini 3 Flash Preview	10.0	10.0	100.0%	0		3.48s	500	281	3,082
Grok 4.20	8.2	7.9	83.3%	1		3.95s	2,010	287	8,312

コーディング	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Gemini 3 Flash Preview	5.8	7.2	44.4%	1		6.00s	8,122	456	7,421
Grok 4.20	6.3	6.6	55.6%	1		109.93s	8,307	268	103,150

複合	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Gemini 3 Flash Preview	3.0	10.0	0.0%	0		10.20s	99,775	7,822	0
Grok 4.20	8.7	6.9	83.3%	1		42.25s	71,267	3,776	44,009

データ解析と抽出	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Gemini 3 Flash Preview	10.0	10.0	100.0%	0		9.40s	7,261	279	3,656
Grok 4.20	10.0	10.0	100.0%	0		4.17s	7,761	180	5,333

ドメイン特化	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Gemini 3 Flash Preview	5.3	7.2	44.4%	1		8.05s	645	12	6,410
Grok 4.20	5.3	10.0	33.3%	0		27.03s	1,764	375	49,339

汎用知能	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Gemini 3 Flash Preview	10.0	10.0	100.0%	0		3.68s	492	120	981
Grok 4.20	3.9	2.6	33.3%	1		24.48s	825	65	6,440

指示追従	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Gemini 3 Flash Preview	9.9	10.0	100.0%	0		7.02s	621	71	2,752
Grok 4.20	9.8	10.0	100.0%	0		4.26s	1,362	57	6,419

パズル解決	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Gemini 3 Flash Preview	10.0	10.0	100.0%	0		5.77s	562	288	3,168
Grok 4.20	7.7	10.0	66.7%	0		6.22s	1,689	149	7,913

ツール呼び出し	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Gemini 3 Flash Preview	10.0	10.0	100.0%	0		4.99s	5,550	234	415
Grok 4.20	3.0	10.0	0.0%	0		13.68s	7,275	197	6,620

雑学	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Gemini 3 Flash Preview	10.0	10.0	100.0%	0		2.75s	156	9	633
Grok 4.20	3.0	10.0	0.0%	0		63.48s	531	9	16,442

クイック比較

比較ペアを切り替え

Claude Sonnet 4.6nonevsGemini 3 Flash Previewlow Gemini 3 Flash PreviewlowvsLongCat 2.0medium Qwen3.7 PlusnonevsGrok 4.20medium Gemini 3 Flash PreviewlowvsQwen3.7 Maxnone Gemini 3 Flash PreviewlowvsQwen3.5-27Bmedium Gemini 3 Flash PreviewlowvsQwen3.5 Plus 2026-02-15medium KAT-Coder-Pro V2.5highvsGrok 4.20medium Claude Opus 4.8nonevsGemini 3 Flash Previewlow Gemini 3 Flash PreviewlowvsGPT-5.4 Minimedium Gemini 3.5 FlashnonevsGrok 4.20medium Gemini 3 Flash PreviewlowvsGPT-5.3 Chatnone Step 3.7 FlashlowvsGrok 4.20medium