AI BENCHY Compare

Qwen: Qwen3.5 Plus 2026-02-15 vs Z.ai: GLM 5

ベンチマークは AI BENCHY テストスイートから次の日時に生成: 2026-04-14

指標	Qwen3.5 Plus 2026-02-15 Qwen3.5 Plus 2026-02-15 none リリース: 2026-02-15	GLM 5 GLM 5 medium リリース: 2026-02-12

指標	Qwen3.5 Plus 2026-02-15 Qwen3.5 Plus 2026-02-15 none リリース: 2026-02-15	GLM 5 GLM 5 medium リリース: 2026-02-12
スコア	6.8	8.4
順位	#46	#11
一貫性	9.3	8.2
正解テスト
試行ごとの合格率	53.7%	85.2%
不安定なテスト	2	4
総実行回数	54	54
結果あたりのコスト	0.182	1.188
合計コスト	$0.017	$0.155
????	$0.260 / 1M	$0.720 / 1M
????	$1.560 / 1M	$2.300 / 1M
出力トークン	2,461	20,163
推論トークン	0	58,337
応答時間（平均）	2.60s	23.34s
応答時間（最大）	6.65s	79.09s
応答時間（合計）	31.23s	233.40s

スコア上位モデル

スコア vs 総コスト

応答時間（平均）

スコア vs 応答時間（平均）

合計出力トークン

スコア vs 合計出力トークン

カテゴリ内訳

反AIトリック	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
Qwen3.5 Plus 2026-02-15	4.8	10.0	25.0%	0		1.91s	517	0
GLM 5	10.0	10.0	100.0%	0		23.66s	480	7,056

コーディング	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
Qwen3.5 Plus 2026-02-15	6.3	3.7	33.3%	1		3.63s	443	0
GLM 5	10.0	10.0	100.0%	0		79.09s	330	19,814

複合	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
Qwen3.5 Plus 2026-02-15	3.0	10.0	0.0%	0		6.65s	314	0
GLM 5	10.0	10.0	100.0%	0		28.96s	662	3,242

データ解析と抽出	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	0		1.89s	243	0
GLM 5	7.1	5.6	83.3%	1		8.90s	567	3,734

ドメイン特化	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
Qwen3.5 Plus 2026-02-15	5.3	10.0	33.3%	0		1.17s	17	0
GLM 5	3.5	4.4	33.3%	2		0ms	13,176	14,137

汎用知能	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
Qwen3.5 Plus 2026-02-15	4.4	3.0	33.3%	1		2.26s	117	0
GLM 5	6.1	3.1	66.7%	1		14.69s	2,020	2,248

指示追従	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	0		1.67s	72	0
GLM 5	10.0	10.0	100.0%	0		7.25s	1,001	2,129

パズル解決	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
Qwen3.5 Plus 2026-02-15	7.7	10.0	66.7%	0		2.82s	516	0
GLM 5	10.0	10.0	100.0%	0		15.64s	1,694	4,983

ツール呼び出し	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
Qwen3.5 Plus 2026-02-15	10.0	10.0	100.0%	0		3.33s	222	0
GLM 5	10.0	10.0	100.0%	0		15.93s	233	994

クイック比較

比較ペアを切り替え

Nemotron 3 Supermedium無料で利用可能vsQwen3.5 Plus 2026-02-15none Qwen3.5 Plus 2026-02-15nonevsGrok 4.1 Fastmedium Qwen3.5 Plus 2026-02-15nonevsGrok 4.20medium Kimi K2.5mediumvsQwen3.5 Plus 2026-02-15none Gemini 3 Flash PreviewnonevsGLM 5medium GPT-5 MinimediumvsQwen3.5 Plus 2026-02-15none Gemini 3.1 Flash Lite PreviewlowvsGLM 5medium Mercury 2mediumvsQwen3.5 Plus 2026-02-15none Gemini 3 Flash PreviewlowvsGLM 5medium GPT-5.2 ChatnonevsGLM 5medium Gemini 3.1 Flash Lite PreviewnonevsGLM 5medium GPT-5.4 MinimediumvsQwen3.5 Plus 2026-02-15none