ナビゲーション
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Qwen: Qwen3.6 27B vs Z.ai: GLM 5

概要

Qwen3.6 27B vs GLM 5 の benchmark 比較: Qwen3.6 27B が平均スコアでリードし、6.6 vs 6.0 です。 GLM 5 の benchmark コストが低く、$0.027 vs $0.430 です。 GLM 5 の方が高速で、4.03s vs 59.71s です、成功率は 60.3% vs 44.4% です。

おすすめモデル: GLM 5 - スコアはここでの最高値に近く(6.0 vs 6.6)、Qwen3.6 27B より約 16.5 倍低コストです。

ベンチマークは AI BENCHY テストスイートから次の日時に生成: 2026-06-12

指標 Qwen3.6 27B Qwen3.6 27B medium リリース: 2026-04-20 GLM 5 GLM 5 none リリース: 2026-02-12
スコア 6.6 6.0
順位 #80 #106
信頼性 10.0 10.0
一貫性 8.2 9.7
正解テスト
試行ごとの合格率 60.3% 44.4%
不安定なテスト 5 1
総実行回数 63 63
結果あたりのコスト 3.361 0.263
合計コスト $0.430 $0.027
入力価格 $0.288 / 1M $0.600 / 1M
出力価格 $3.100 / 1M $1.920 / 1M
合計入力トークン 39,376 37,135
出力トークン 16,189 1,989
推論トークン 122,521 0
応答時間(平均) 59.71s 4.03s
応答時間(最大) 168.22s 11.07s
応答時間(合計) 1254.01s 56.37s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#80 Qwen3.6 27B

medium
Cost
$0.009
Time
39.6s
Tokens
3,090 tok

#106 GLM 5

none
Cost
$0.007
Time
32.1s
Tokens
2,023 tok

スコア上位モデル

スコア vs 総コスト

応答時間(平均)

スコア vs 応答時間(平均)

合計出力トークン

スコア vs 合計出力トークン

カテゴリ内訳

反AIトリック スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Qwen3.6 27B 8.3 10.0 75.0% 0 12.62s 453 582 4,311
GLM 5 4.8 10.0 25.0% 0 2.37s 510 275 0
コーディング スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Qwen3.6 27B 7.7 10.0 66.7% 0 142.99s 5,051 7,968 43,367
GLM 5 4.0 7.8 11.1% 1 5.12s 7,256 428 0
複合 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Qwen3.6 27B 7.0 3.7 66.7% 1 83.07s 15,104 2,088 14,689
GLM 5 3.0 10.0 0.0% 0 4.98s 12,812 406 0
データ解析と抽出 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Qwen3.6 27B 3.5 1.4 50.0% 2 37.30s 7,778 568 9,404
GLM 5 10.0 10.0 100.0% 0 5.78s 7,107 203 0
ドメイン特化 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Qwen3.6 27B 2.9 7.2 11.1% 1 73.38s 662 3,510 20,352
GLM 5 3.0 10.0 0.0% 0 2.24s 643 19 0
汎用知能 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Qwen3.6 27B 6.5 3.4 66.7% 1 39.53s 516 81 3,045
GLM 5 10.0 10.0 100.0% 0 3.27s 477 103 0
指示追従 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Qwen3.6 27B 10.0 10.0 100.0% 0 37.96s 699 346 6,548
GLM 5 10.0 10.0 100.0% 0 1.48s 636 61 0
パズル解決 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Qwen3.6 27B 7.7 10.0 66.7% 0 61.14s 696 255 12,044
GLM 5 7.7 10.0 66.7% 0 1.91s 609 261 0
ツール呼び出し スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Qwen3.6 27B 10.0 10.0 100.0% 0 16.88s 8,213 390 2,954
GLM 5 10.0 10.0 100.0% 0 11.07s 6,899 220 0
雑学 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Qwen3.6 27B 3.0 10.0 0.0% 0 80.99s 204 401 5,807
GLM 5 3.0 10.0 0.0% 0 3.62s 186 13 0

クイック比較

比較ペアを切り替え