AI BENCHY Compare

Google: Gemini 3 Flash Preview vs OpenAI: GPT-5 Mini

概要

Gemini 3 Flash Preview vs GPT-5 Mini の benchmark 比較: GPT-5 Mini が平均スコアでリードし、8.5 vs 7.4 です。 Gemini 3 Flash Preview の benchmark コストが低く、$0.111 vs $0.159 です。 Gemini 3 Flash Preview の方が高速で、5.76s vs 23.64s です、成功率は 79.4% vs 63.5% です。

おすすめモデル: Gemini 3 Flash Preview - 総合的に最も良い選択です。競争力のあるスコア（7.4）、GPT-5 Mini より低いコスト、バランスの取れた応答時間があります。

ベンチマークは AI BENCHY テストスイートから次の日時に生成: 2026-06-12

指標	Gemini 3 Flash Preview Gemini 3 Flash Preview low リリース: 2025-12-17	GPT-5 Mini GPT-5 Mini medium リリース: 2025-08-07

指標	Gemini 3 Flash Preview Gemini 3 Flash Preview low リリース: 2025-12-17	GPT-5 Mini GPT-5 Mini medium リリース: 2025-08-07
スコア	7.4	8.5
順位	#53	#19
信頼性	10.0	10.0
一貫性	9.2	9.1
正解テスト
試行ごとの合格率	79.4%	63.5%
不安定なテスト	2	2
総実行回数	63	63
結果あたりのコスト	0.689	1.319
合計コスト	$0.111	$0.159
入力価格	$0.500 / 1M	$0.250 / 1M
出力価格	$3.000 / 1M	$2.000 / 1M
合計入力トークン	36,769	37,100
出力トークン	2,076	6,801
推論トークン	28,518	67,690
応答時間（平均）	5.76s	23.64s
応答時間（最大）	14.72s	88.15s
応答時間（合計）	120.93s	496.44s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#53 Gemini 3 Flash Preview

low

Cost: $0.007
Time: 12.1s
Tokens: 2,289 tok

#19 GPT-5 Mini

medium

Cost: $0.007
Time: 42.9s
Tokens: 3,432 tok

スコア上位モデル

スコア vs 総コスト

応答時間（平均）

スコア vs 応答時間（平均）

合計出力トークン

スコア vs 合計出力トークン

カテゴリ内訳

反AIトリック	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Gemini 3 Flash Preview	10.0	10.0	100.0%	0		3.48s	500	281	3,082
GPT-5 Mini	7.1	7.6	66.7%	1		13.86s	606	1,715	6,378

コーディング	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Gemini 3 Flash Preview	5.8	7.2	44.4%	1		6.00s	8,122	456	7,421
GPT-5 Mini	10.0	10.0	100.0%	0		27.63s	7,302	658	17,152

複合	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Gemini 3 Flash Preview	3.0	10.0	0.0%	0		3.27s	12,860	326	0
GPT-5 Mini	10.0	10.0	100.0%	0		88.15s	14,118	754	11,520

データ解析と抽出	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Gemini 3 Flash Preview	10.0	10.0	100.0%	0		9.40s	7,261	279	3,656
GPT-5 Mini	10.0	10.0	100.0%	0		12.58s	7,140	453	3,200

ドメイン特化	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Gemini 3 Flash Preview	5.3	7.2	44.4%	1		8.05s	645	12	6,410
GPT-5 Mini	3.6	7.2	22.2%	1		44.63s	515	293	14,016

汎用知能	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Gemini 3 Flash Preview	10.0	10.0	100.0%	0		3.68s	492	120	981
GPT-5 Mini	4.5	10.0	0.0%	0		13.50s	477	349	1,856

指示追従	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Gemini 3 Flash Preview	9.9	10.0	100.0%	0		7.02s	621	71	2,752
GPT-5 Mini	10.0	10.0	100.0%	0		11.59s	660	310	3,968

パズル解決	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Gemini 3 Flash Preview	10.0	10.0	100.0%	0		5.77s	562	288	3,168
GPT-5 Mini	5.6	9.8	33.3%	0		15.20s	642	1,622	6,144

ツール呼び出し	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Gemini 3 Flash Preview	10.0	10.0	100.0%	0		4.99s	5,550	234	415
GPT-5 Mini	10.0	10.0	100.0%	0		18.64s	5,445	487	1,600

雑学	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Gemini 3 Flash Preview	10.0	10.0	100.0%	0		2.75s	156	9	633
GPT-5 Mini	3.0	10.0	0.0%	0		9.99s	195	160	1,856

クイック比較

比較ペアを切り替え