Gemini 3.1 Pro Preview (medium) vs Qwen3.7 Max

おすすめモデル Qwen3.7 Max

総合的に最も良い選択です。競争力のあるスコア（7.4）、Gemini 3.1 Pro Preview (medium) より低いコスト、バランスの取れた応答時間があります。

ベンチマークは AI BENCHY テストスイートから次の日時に生成: 2026-07-25

比較の概要

指標	Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium リリース: 2026-02-19	Qwen3.7 Max Qwen3.7 Max none リリース: 2026-05-22

指標	Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium リリース: 2026-02-19	Qwen3.7 Max Qwen3.7 Max none リリース: 2026-05-22
スコア	9.2	7.4
順位	#10	#67
信頼性	10.0	9.9
一貫性	10.0	10.0
正解テスト
試行ごとの合格率	90.9%	68.2%
不安定なテスト	0	0
総実行回数	66	66
結果あたりのコスト	6.801	1.582
合計コスト	$1.361	$0.197
入力価格	$2.000 / 1M	$1.475 / 1M
出力価格	$12.000 / 1M	$4.425 / 1M
合計入力トークン	92,287	95,983
出力トークン	5,232	12,446
推論トークン	92,726	0
応答時間（平均）	21.47s	4.52s
応答時間（最大）	88.68s	72.30s
応答時間（合計）	322.08s	99.52s

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

medium

none

カテゴリ:

反AIトリック	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		7.90s	498	112	3,218
Qwen3.7 Max	6.5	10.0	50.0%	0		1.08s	696	242	0

コーディング	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Gemini 3.1 Pro Preview	7.9	9.9	66.7%	0		40.17s	8,124	435	41,247
Qwen3.7 Max	5.5	10.0	33.3%	0		1.35s	7,911	582	0

複合	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Gemini 3.1 Pro Preview	9.8	10.0	100.0%	0		40.39s	67,910	3,687	23,111
Qwen3.7 Max	6.5	10.0	50.0%	0		37.23s	68,425	10,623	0

データ解析と抽出	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		7.72s	7,265	279	3,904
Qwen3.7 Max	10.0	10.0	100.0%	0		1.35s	7,794	243	0

ドメイン特化	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Gemini 3.1 Pro Preview	7.7	10.0	66.7%	0		32.73s	635	18	12,424
Qwen3.7 Max	7.7	10.0	66.7%	0		975ms	789	15	0

汎用知能	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		11.77s	490	108	1,179
Qwen3.7 Max	10.0	10.0	100.0%	0		1.04s	522	120	0

指示追従	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		9.56s	621	72	2,236
Qwen3.7 Max	10.0	10.0	100.0%	0		943ms	711	72	0

パズル解決	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		6.90s	570	235	3,128
Qwen3.7 Max	10.0	10.0	100.0%	0		1.13s	714	314	0

ツール呼び出し	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		23.15s	6,018	274	982
Qwen3.7 Max	10.0	10.0	100.0%	0		3.92s	8,211	222	0

雑学	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	入力トークン	出力トークン	推論トークン
Gemini 3.1 Pro Preview	10.0	10.0	100.0%	0		6.27s	156	12	1,297
Qwen3.7 Max	3.0	10.0	0.0%	0		856ms	210	13	0

比較ペアを切り替え