AI BENCHY Compare

Inception: Mercury 2 vs Qwen: Qwen3.5-9B

ベンチマークは AI BENCHY テストスイートから次の日時に生成: 2026-03-12

指標	Mercury 2 Mercury 2 none リリース: 2026-02-24	Qwen3.5-9B Qwen3.5-9B none リリース: 2026-03-02

指標	Mercury 2 Mercury 2 none リリース: 2026-02-24	Qwen3.5-9B Qwen3.5-9B none リリース: 2026-03-02
順位	#61	#60
平均スコア	3.4	3.4
一貫性	9.0	10.0
結果あたりのコスト	0.153	0.111
合計コスト	$0.007	$0.005
正解テスト
試行ごとの合格率	31.3%	25.0%
不安定なテスト	2	0
総実行回数	48	48
出力トークン	1,303	2,939
推論トークン	0	0
応答時間（平均）	596ms	1.06s
応答時間（最大）	1.27s	5.91s
応答時間（合計）	9.54s	16.95s

スコア上位モデル

スコア vs 総コスト

応答時間（平均）

平均スコア vs 応答時間（平均）

合計出力トークン

平均スコア vs 合計出力トークン

カテゴリ内訳

反AIトリック	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
Mercury 2	10.0	10.0	0.0%	0		466ms	274	0
Qwen3.5-9B	10.0	9.9	0.0%	0		1.02s	576	0

複合	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
Mercury 2	10.0	10.0	0.0%	0		606ms	131	0
Qwen3.5-9B	10.0	10.0	0.0%	0		5.91s	1,255	0

データ解析と抽出	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
Mercury 2	5.5	5.9	83.3%	1		667ms	180	0
Qwen3.5-9B	9.9	10.0	100.0%	0		847ms	249	0

ドメイン特化	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
Mercury 2	4.0	7.2	44.4%	1		534ms	46	0
Qwen3.5-9B	10.0	10.0	0.0%	0		464ms	24	0

汎用知能	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
Mercury 2	4.0	10.0	0.0%	0		628ms	159	0
Qwen3.5-9B	3.0	9.9	0.0%	0		552ms	99	0

指示追従	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
Mercury 2	5.5	10.0	50.0%	0		551ms	82	0
Qwen3.5-9B	5.5	10.0	50.0%	0		514ms	75	0

Puzzle Solving	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
Mercury 2	10.0	10.0	0.0%	0		533ms	234	0
Qwen3.5-9B	10.0	9.9	0.0%	0		683ms	388	0

ツール呼び出し	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
Mercury 2	10.0	10.0	100.0%	0		1.27s	197	0
Qwen3.5-9B	10.0	10.0	100.0%	0		1.27s	273	0

クイック比較

比較ペアを切り替え

Mercury 2nonevsQwen3 Coder Nextmedium Mercury 2nonevsGLM 4.7 Flashmedium Qwen3.5-9BnonevsGLM 4.7 Flashmedium Mercury 2nonevsQwen3.5-9Bmedium MiniMax M2.5mediumvsQwen3.5-9Bnone Mercury 2nonevsMiniMax M2.5medium Qwen3.5-9BnonevsGrok 4.20 Multi-Agent Betamedium Mercury 2nonevsGrok 4.20 Multi-Agent Betamedium gpt-oss-120bmedium無料で利用可能vsQwen3.5-9Bnone Mercury 2nonevsgpt-oss-120bmedium無料で利用可能 Mercury 2mediumvsQwen3.5-9Bnone GPT-5 NanomediumvsQwen3.5-9Bnone