AI BENCHY Compare

Gemini 3 PRO Preview vs OpenAI: GPT-5.5

ベンチマークは AI BENCHY テストスイートから次の日時に生成: 2026-04-24

指標	Gemini 3 PRO Preview Gemini 3 PRO Preview medium リリース: 2025-11-18	GPT-5.5 GPT-5.5 medium リリース: 2026-04-24

指標	Gemini 3 PRO Preview Gemini 3 PRO Preview medium リリース: 2025-11-18	GPT-5.5 GPT-5.5 medium リリース: 2026-04-24
スコア	8.4	9.0
順位	#14	#5
信頼性	該当なし	該当なし
一貫性	10.0	9.2
正解テスト
試行ごとの合格率	77.8%	87.0%
不安定なテスト	0	2
総実行回数	54	54
結果あたりのコスト	1.406	19.226
合計コスト	$0.197	$2.884
????	$0.000 / 1M	$5.000 / 1M
????	$0.000 / 1M	$30.000 / 1M
出力トークン	1,508	1,920
推論トークン	10,084	89,632
応答時間（平均）	9.06s	32.75s
応答時間（最大）	26.24s	332.10s
応答時間（合計）	90.58s	589.59s

スコア上位モデル

スコア vs 総コスト

応答時間（平均）

スコア vs 応答時間（平均）

合計出力トークン

スコア vs 合計出力トークン

カテゴリ内訳

反AIトリック	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
Gemini 3 PRO Preview	10.0	10.0	100.0%	0		14.99s	149	1,485
GPT-5.5	10.0	10.0	100.0%	0		4.66s	250	1,335

コーディング	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
Gemini 3 PRO Preview	3.0	10.0	0.0%	0		0ms	0	0
GPT-5.5	10.0	10.0	100.0%	0		9.09s	318	1,391

複合	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
Gemini 3 PRO Preview	3.0	10.0	0.0%	0		10.37s	351	952
GPT-5.5	10.0	10.0	100.0%	0		19.29s	312	2,841

データ解析と抽出	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
Gemini 3 PRO Preview	10.0	10.0	100.0%	0		10.84s	279	3,156
GPT-5.5	10.0	10.0	100.0%	0		4.18s	234	593

ドメイン特化	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
Gemini 3 PRO Preview	5.3	10.0	33.3%	0		7.01s	15	1,195
GPT-5.5	5.3	7.2	44.4%	1		164.14s	67	79,625

汎用知能	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
Gemini 3 PRO Preview	10.0	10.0	100.0%	0		9.34s	78	374
GPT-5.5	10.0	10.0	100.0%	0		4.16s	138	223

指示追従	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
Gemini 3 PRO Preview	9.8	10.0	100.0%	0		3.26s	69	754
GPT-5.5	10.0	10.0	100.0%	0		3.36s	93	538

パズル解決	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
Gemini 3 PRO Preview	10.0	10.0	100.0%	0		3.91s	243	1,197
GPT-5.5	8.6	7.9	77.8%	1		6.78s	250	2,254

ツール呼び出し	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
Gemini 3 PRO Preview	10.0	10.0	100.0%	0		11.96s	324	971
GPT-5.5	10.0	10.0	100.0%	0		10.57s	258	832

クイック比較

比較ペアを切り替え

Gemini 3 PRO PreviewmediumvsHY3 Previewhigh無料で利用可能 Gemini 3 Flash PreviewlowvsGPT-5.5medium Claude Opus 4.7nonevsGPT-5.5medium Gemini 3 PRO PreviewmediumvsHY3 Previewlow無料で利用可能 Gemini 3 PRO PreviewmediumvsGPT-5.2 Chatnone GPT-5.5mediumvsHY3 Previewhigh無料で利用可能 DeepSeek V4 FlashhighvsGemini 3 PRO Previewmedium Gemini 3 PRO PreviewmediumvsGPT-5.3 Chatnone Claude Opus 4.7nonevsGemini 3 PRO Previewmedium GPT-5.5mediumvsHY3 Previewlow無料で利用可能 Gemini 3 Flash PreviewnonevsGPT-5.5medium Gemini 3.1 Flash Lite PreviewlowvsGPT-5.5medium