比較するチャート方法論

言語:

❤️ Made by XCS

AI BENCHY Compare

Trinity Large Preview vs Z.ai: GLM 4.7 Flash

比較する:

ベンチマークは AI BENCHY テストスイートから次の日時に生成: 2026-03-06

指標	Trinity Large Preview none リリース: 2026-01-27 無料で利用可能	Z.ai: GLM 4.7 Flash medium リリース: 2026-01-19
順位	#45	#52
平均スコア	4.2	3.1
一貫性	9.6	6.4
結果あたりのコスト	0.000	1.040
合計コスト	$0.000	$0.042
正解テスト
試行ごとの合格率	33.3%	41.7%
不安定なテスト	1	7
総実行回数	48	48
出力トークン	1,837	38,682
推論トークン	0	64,952
応答時間（平均）	3.15s	36.84s
応答時間（最大）	8.91s	174.55s
応答時間（合計）	50.46s	331.58s

スコア上位モデル

スコア vs 総コスト

応答時間（平均）

平均スコア vs 応答時間（平均）

カテゴリ内訳

反AIトリック	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
Trinity Large Preview	10.0	10.0	0.0%	0		3.59s	587	0
Z.ai: GLM 4.7 Flash	4.0	4.5	55.6%	2		27.09s	1,085	5,597

複合	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
Trinity Large Preview	10.0	10.0	0.0%	0		8.91s	294	0
Z.ai: GLM 4.7 Flash	10.0	2.1	33.3%	1		65.57s	2,585	20,648

データ解析と抽出	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
Trinity Large Preview	9.9	10.0	100.0%	0		3.26s	186	0
Z.ai: GLM 4.7 Flash	5.0	10.0	50.0%	0		1.51s	584	2,755

ドメイン特化	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
Trinity Large Preview	4.0	10.0	33.3%	0		877ms	25	0
Z.ai: GLM 4.7 Flash	10.0	4.4	33.3%	2		174.55s	33,000	25,394

汎用知能	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
Trinity Large Preview	3.0	9.9	0.0%	0		2.86s	124	0
Z.ai: GLM 4.7 Flash	10.0	9.7	0.0%	0		18.14s	18	2,138

指示追従	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
Trinity Large Preview	3.5	6.7	16.7%	1		1.09s	63	0
Z.ai: GLM 4.7 Flash	5.0	5.8	66.7%	1		2.97s	388	2,181

Puzzle Solving	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
Trinity Large Preview	4.0	10.0	33.3%	0		3.30s	291	0
Z.ai: GLM 4.7 Flash	10.0	7.2	11.1%	1		12.90s	798	5,225

ツール呼び出し	スコア	一貫性	試行ごとの合格率	不安定なテスト	正解テスト	応答時間（平均）	出力トークン	推論トークン
Trinity Large Preview	10.0	10.0	100.0%	0		6.67s	267	0
Z.ai: GLM 4.7 Flash	10.0	10.0	100.0%	0		15.95s	224	1,014

クイック比較

比較ペアを切り替え

Grok 4.1 FastnonevsGLM 4.7 Flashmedium MiMo-V2-FlashnonevsGLM 4.7 Flashmedium Mercury 2nonevsGLM 4.7 Flashmedium Trinity Large Previewnone無料で利用可能vsMiniMax M2.5medium LFM2-24B-A2BnonevsGLM 4.7 Flashmedium Trinity Large Previewnone無料で利用可能vsQwen3 Coder Nextmedium Trinity Large Previewnone無料で利用可能vsgpt-oss-120bmedium無料で利用可能 Qwen3 Coder NextnonevsGLM 4.7 Flashmedium GPT-4o-mininonevsGLM 4.7 Flashmedium Kimi K2.5nonevsGLM 4.7 Flashmedium Trinity Large Previewnone無料で利用可能vsMercury 2medium Trinity Large Previewnone無料で利用可能vsQwen3.5-35B-A3Bmedium