AI BENCHY Compare

Qwen: Qwen3.5-122B-A10B vs Qwen: Qwen3.5 Plus 2026-04-20

ベンチマークは AI BENCHY テストスイートから次の日時に生成: 2026-05-29

指標	Qwen3.5-122B-A10B Qwen3.5-122B-A10B none リリース: 2026-02-24	Qwen3.5 Plus 2026-04-20 Qwen3.5 Plus 2026-04-20 none リリース: 2026-04-20

指標	Qwen3.5-122B-A10B Qwen3.5-122B-A10B none リリース: 2026-02-24	Qwen3.5 Plus 2026-04-20 Qwen3.5 Plus 2026-04-20 none リリース: 2026-04-20
スコア	5.4	5.8
順位	#130	#109
信頼性	10.0	10.0
一貫性	9.5	8.5
正解テスト
試行ごとの合格率	33.3%	43.3%
不安定なテスト	1	4
総実行回数	60	60
結果あたりのコスト	0.380	0.582
合計コスト	$0.023	$0.041
入力価格	$0.260 / 1M	$0.300 / 1M
出力価格	$2.080 / 1M	$1.800 / 1M
出力トークン	3,374	11,139
推論トークン	0	0
応答時間（平均）	3.38s	4.57s
応答時間（最大）	46.00s	33.34s
応答時間（合計）	67.55s	91.37s

スコア上位モデル

スコア vs 総コスト

応答時間（平均）

スコア vs 応答時間（平均）

合計出力トークン

スコア vs 合計出力トークン

カテゴリ内訳

反AIトリック	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
Qwen3.5-122B-A10B	4.8	10.0	25.0%	0		1.59s	312	0
Qwen3.5 Plus 2026-04-20	4.8	10.0	25.0%	0		1.88s	557	0

コーディング	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
Qwen3.5-122B-A10B	4.0	5.5	33.3%	1		2.14s	684	0
Qwen3.5 Plus 2026-04-20	4.4	6.7	16.7%	1		2.08s	474	0

複合	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
Qwen3.5-122B-A10B	3.0	10.0	0.0%	0		46.00s	1,137	0
Qwen3.5 Plus 2026-04-20	2.8	1.6	33.3%	1		13.32s	2,275	0

データ解析と抽出	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
Qwen3.5-122B-A10B	10.0	10.0	100.0%	0		1.01s	243	0
Qwen3.5 Plus 2026-04-20	10.0	10.0	100.0%	0		2.82s	243	0

ドメイン特化	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
Qwen3.5-122B-A10B	5.3	10.0	33.3%	0		465ms	15	0
Qwen3.5 Plus 2026-04-20	5.3	10.0	33.3%	0		4.43s	18	0

汎用知能	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
Qwen3.5-122B-A10B	5.0	10.0	0.0%	0		1.12s	66	0
Qwen3.5 Plus 2026-04-20	4.8	10.0	0.0%	0		1.41s	119	0

指示追従	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
Qwen3.5-122B-A10B	6.3	10.0	50.0%	0		513ms	69	0
Qwen3.5 Plus 2026-04-20	6.2	5.8	66.7%	1		1.17s	68	0

パズル解決	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
Qwen3.5-122B-A10B	3.8	10.0	0.0%	0		1.00s	575	0
Qwen3.5 Plus 2026-04-20	6.7	7.9	55.6%	1		1.97s	583	0

ツール呼び出し	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
Qwen3.5-122B-A10B	10.0	10.0	100.0%	0		2.04s	264	0
Qwen3.5 Plus 2026-04-20	10.0	10.0	100.0%	0		4.42s	297	0

雑学	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
Qwen3.5-122B-A10B	3.0	10.0	0.0%	0		295ms	9	0
Qwen3.5 Plus 2026-04-20	3.0	10.0	0.0%	0		33.34s	6,505	0

クイック比較

比較ペアを切り替え

MiniMax M2.7mediumvsQwen3.5-122B-A10Bnone Elephant AlphamediumvsQwen3.5-122B-A10Bnone Mistral Small 4mediumvsQwen3.5-122B-A10Bnone CobuddymediumvsQwen3.5 Plus 2026-04-20none Owl AlphamediumvsQwen3.5 Plus 2026-04-20none MiniMax M2.5medium無料で利用可能vsQwen3.5-122B-A10Bnone gpt-oss-120bmedium無料で利用可能vsQwen3.5 Plus 2026-04-20none Nemotron 3 Supermedium無料で利用可能vsQwen3.5 Plus 2026-04-20none GPT-5 NanomediumvsQwen3.5 Plus 2026-04-20none MiniMax M2.5medium無料で利用可能vsQwen3.5 Plus 2026-04-20none CobuddymediumvsQwen3.5-122B-A10Bnone Mistral Small 4mediumvsQwen3.5 Plus 2026-04-20none