ナビゲーション
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Qwen: Qwen3.6 27B vs Qwen: Qwen3.6 Max Preview

概要

Qwen3.6 27B vs Qwen3.6 Max Preview の benchmark 比較: Qwen3.6 Max Preview が平均スコアでリードし、6.9 vs 6.8 です。 Qwen3.6 Max Preview の benchmark コストが低く、$0.075 vs $0.336 です。 Qwen3.6 Max Preview の方が高速で、3.30s vs 59.71s です、成功率は 60.3% vs 58.7% です。

おすすめモデル: Qwen3.6 Max Preview - ここでは最高スコア(6.9)で、Qwen3.6 27B より約 4.5 倍低コストです。

ベンチマークは AI BENCHY テストスイートから次の日時に生成: 2026-06-10

指標 Qwen3.6 27B Qwen3.6 27B medium リリース: 2026-04-20 Qwen3.6 Max Preview Qwen3.6 Max Preview none リリース: 2026-04-20
スコア 6.8 6.9
順位 #79 #75
信頼性 10.0 10.0
一貫性 8.2 9.2
正解テスト
試行ごとの合格率 60.3% 58.7%
不安定なテスト 5 2
総実行回数 63 63
結果あたりのコスト 3.361 0.824
合計コスト $0.336 $0.075
入力価格 $0.290 / 1M $1.040 / 1M
出力価格 $2.400 / 1M $6.240 / 1M
合計入力トークン 39,376 42,509
出力トークン 16,189 4,779
推論トークン 122,521 0
応答時間(平均) 59.71s 3.30s
応答時間(最大) 168.22s 20.51s
応答時間(合計) 1254.01s 69.40s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#79 Qwen3.6 27B

medium
Cost
$0.009
Time
39.6s
Tokens
3,090 tok

#75 Qwen3.6 Max Preview

none
Cost
$0.025
Time
83.9s
Tokens
4,066 tok

スコア上位モデル

スコア vs 総コスト

応答時間(平均)

スコア vs 応答時間(平均)

合計出力トークン

スコア vs 合計出力トークン

カテゴリ内訳

反AIトリック スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Qwen3.6 27B 8.3 10.0 75.0% 0 12.62s 453 582 4,311
Qwen3.6 Max Preview 5.2 7.9 41.7% 1 2.63s 696 513 0
コーディング スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Qwen3.6 27B 7.7 10.0 66.7% 0 142.99s 5,051 7,968 43,367
Qwen3.6 Max Preview 3.8 7.3 22.2% 1 3.12s 7,913 456 0
複合 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Qwen3.6 27B 7.0 3.7 66.7% 1 83.07s 15,104 2,088 14,689
Qwen3.6 Max Preview 3.0 10.0 0.0% 0 20.51s 14,949 2,842 0
データ解析と抽出 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Qwen3.6 27B 3.5 1.4 50.0% 2 37.30s 7,778 568 9,404
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 2.87s 7,794 243 0
ドメイン特化 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Qwen3.6 27B 2.9 7.2 11.1% 1 73.38s 662 3,510 20,352
Qwen3.6 Max Preview 7.7 10.0 66.7% 0 1.22s 789 18 0
汎用知能 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Qwen3.6 27B 6.5 3.4 66.7% 1 39.53s 516 81 3,045
Qwen3.6 Max Preview 4.3 10.0 0.0% 0 1.62s 522 76 0
指示追従 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Qwen3.6 27B 10.0 10.0 100.0% 0 37.96s 699 346 6,548
Qwen3.6 Max Preview 9.8 10.0 100.0% 0 1.40s 711 69 0
パズル解決 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Qwen3.6 27B 7.7 10.0 66.7% 0 61.14s 696 255 12,044
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 2.65s 714 321 0
ツール呼び出し スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Qwen3.6 27B 10.0 10.0 100.0% 0 16.88s 8,213 390 2,954
Qwen3.6 Max Preview 10.0 10.0 100.0% 0 5.27s 8,211 222 0
雑学 スコア 一貫性 試行ごとの合格率 不安定なテスト 正解テスト 応答時間(平均) 入力トークン 出力トークン 推論トークン
Qwen3.6 27B 3.0 10.0 0.0% 0 80.99s 204 401 5,807
Qwen3.6 Max Preview 3.0 10.0 0.0% 0 1.97s 210 19 0

クイック比較

比較ペアを切り替え