AI BENCHY Compare

Google: Gemini 3 Flash Preview vs OpenAI: GPT-5.2

概要

Gemini 3 Flash Preview vs GPT-5.2 の benchmark 比較: GPT-5.2 が平均スコアでリードし、8.4 vs 7.4 です。 Gemini 3 Flash Preview の benchmark コストが低く、$0.111 vs $0.548 です。 Gemini 3 Flash Preview の方が高速で、5.76s vs 16.88s です、成功率は 79.4% vs 71.4% です。

おすすめモデル: Gemini 3 Flash Preview - 総合的に最も良い選択です。競争力のあるスコア（7.4）、GPT-5.2 より低いコスト、バランスの取れた応答時間があります。

ベンチマークは AI BENCHY テストスイートから次の日時に生成: 2026-06-12

指標	Gemini 3 Flash Preview Gemini 3 Flash Preview low リリース: 2025-12-17	GPT-5.2 GPT-5.2 medium リリース: 2025-12-11

指標	Gemini 3 Flash Preview Gemini 3 Flash Preview low リリース: 2025-12-17	GPT-5.2 GPT-5.2 medium リリース: 2025-12-11
スコア	7.4	8.4
順位	#53	#25
信頼性	10.0	10.0
一貫性	9.2	8.4
正解テスト
試行ごとの合格率	79.4%	71.4%
不安定なテスト	2	4
総実行回数	63	63
結果あたりのコスト	0.689	4.209
合計コスト	$0.111	$0.548
入力価格	$0.500 / 1M	$1.750 / 1M
出力価格	$3.000 / 1M	$14.000 / 1M
合計入力トークン	36,769	33,967
出力トークン	2,076	2,901
推論トークン	28,518	31,932
応答時間（平均）	5.76s	16.88s
応答時間（最大）	14.72s	77.80s
応答時間（合計）	120.93s	236.34s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#53 Gemini 3 Flash Preview

low

Cost: $0.007
Time: 12.1s
Tokens: 2,289 tok

#25 GPT-5.2

medium

Cost: $0.047
Time: 49.2s
Tokens: 3,396 tok

スコア上位モデル

スコア vs 総コスト

応答時間（平均）

スコア vs 応答時間（平均）

合計出力トークン

スコア vs 合計出力トークン

カテゴリ内訳

反AIトリック	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Gemini 3 Flash Preview	10.0	10.0	100.0%	0		3.48s	500	281	3,082
GPT-5.2	6.5	8.0	58.3%	1		7.81s	606	567	2,002

コーディング	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Gemini 3 Flash Preview	5.8	7.2	44.4%	1		6.00s	8,122	456	7,421
GPT-5.2	10.0	10.0	100.0%	0		22.73s	7,302	511	11,912

複合	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Gemini 3 Flash Preview	3.0	10.0	0.0%	0		3.27s	12,860	326	0
GPT-5.2	10.0	10.0	100.0%	0		14.06s	11,019	291	1,757

データ解析と抽出	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Gemini 3 Flash Preview	10.0	10.0	100.0%	0		9.40s	7,261	279	3,656
GPT-5.2	10.0	10.0	100.0%	0		3.15s	7,140	234	420

ドメイン特化	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Gemini 3 Flash Preview	5.3	7.2	44.4%	1		8.05s	645	12	6,410
GPT-5.2	5.9	7.2	55.6%	1		77.80s	473	42	10,342

汎用知能	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Gemini 3 Flash Preview	10.0	10.0	100.0%	0		3.68s	492	120	981
GPT-5.2	3.7	9.7	0.0%	0		4.32s	477	162	269

指示追従	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Gemini 3 Flash Preview	9.9	10.0	100.0%	0		7.02s	621	71	2,752
GPT-5.2	9.9	10.0	100.0%	0		3.12s	660	94	614

パズル解決	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Gemini 3 Flash Preview	10.0	10.0	100.0%	0		5.77s	562	288	3,168
GPT-5.2	7.5	7.3	77.8%	1		5.80s	642	735	924

ツール呼び出し	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Gemini 3 Flash Preview	10.0	10.0	100.0%	0		4.99s	5,550	234	415
GPT-5.2	4.7	1.6	66.7%	1		10.30s	5,453	239	469

雑学	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Gemini 3 Flash Preview	10.0	10.0	100.0%	0		2.75s	156	9	633
GPT-5.2	3.0	10.0	0.0%	0		28.18s	195	26	3,223

クイック比較

比較ペアを切り替え