AI BENCHY Compare

OpenAI: GPT-5.5 vs Z.ai: GLM 5

ベンチマークは AI BENCHY テストスイートから次の日時に生成: 2026-04-24

指標	GPT-5.5 GPT-5.5 medium リリース: 2026-04-24	GLM 5 GLM 5 medium リリース: 2026-02-12

指標	GPT-5.5 GPT-5.5 medium リリース: 2026-04-24	GLM 5 GLM 5 medium リリース: 2026-02-12
スコア	9.0	8.4
順位	#5	#15
信頼性	該当なし	該当なし
一貫性	9.2	8.2
正解テスト
試行ごとの合格率	87.0%	85.2%
不安定なテスト	2	4
総実行回数	54	54
結果あたりのコスト	19.226	1.188
合計コスト	$2.884	$0.155
????	$5.000 / 1M	$0.600 / 1M
????	$30.000 / 1M	$2.080 / 1M
出力トークン	1,920	20,163
推論トークン	89,632	58,337
応答時間（平均）	32.75s	23.34s
応答時間（最大）	332.10s	79.09s
応答時間（合計）	589.59s	233.40s

スコア上位モデル

スコア vs 総コスト

応答時間（平均）

スコア vs 応答時間（平均）

合計出力トークン

スコア vs 合計出力トークン

カテゴリ内訳

反AIトリック	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
GPT-5.5	10.0	10.0	100.0%	0		4.66s	250	1,335
GLM 5	10.0	10.0	100.0%	0		23.66s	480	7,056

コーディング	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
GPT-5.5	10.0	10.0	100.0%	0		9.09s	318	1,391
GLM 5	10.0	10.0	100.0%	0		79.09s	330	19,814

複合	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
GPT-5.5	10.0	10.0	100.0%	0		19.29s	312	2,841
GLM 5	10.0	10.0	100.0%	0		28.96s	662	3,242

データ解析と抽出	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
GPT-5.5	10.0	10.0	100.0%	0		4.18s	234	593
GLM 5	7.1	5.6	83.3%	1		8.90s	567	3,734

ドメイン特化	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
GPT-5.5	5.3	7.2	44.4%	1		164.14s	67	79,625
GLM 5	3.5	4.4	33.3%	2		0ms	13,176	14,137

汎用知能	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
GPT-5.5	10.0	10.0	100.0%	0		4.16s	138	223
GLM 5	6.1	3.1	66.7%	1		14.69s	2,020	2,248

指示追従	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
GPT-5.5	10.0	10.0	100.0%	0		3.36s	93	538
GLM 5	10.0	10.0	100.0%	0		7.25s	1,001	2,129

パズル解決	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
GPT-5.5	8.6	7.9	77.8%	1		6.78s	250	2,254
GLM 5	10.0	10.0	100.0%	0		15.64s	1,694	4,983

ツール呼び出し	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
GPT-5.5	10.0	10.0	100.0%	0		10.57s	258	832
GLM 5	10.0	10.0	100.0%	0		15.93s	233	994

クイック比較

比較ペアを切り替え

HY3 Previewhigh無料で利用可能vsGLM 5medium Gemini 3 Flash PreviewlowvsGPT-5.5medium Claude Opus 4.7nonevsGPT-5.5medium DeepSeek V4 ProhighvsGLM 5medium HY3 Previewlow無料で利用可能vsGLM 5medium Gemini 3 Flash PreviewnonevsGLM 5medium Gemini 3.1 Flash Lite PreviewlowvsGLM 5medium Gemini 3 Flash PreviewlowvsGLM 5medium GPT-5.2 ChatnonevsGLM 5medium Gemini 3.1 Flash Lite PreviewnonevsGLM 5medium GPT-5.5mediumvsHY3 Previewhigh無料で利用可能 DeepSeek V4 FlashhighvsGLM 5medium