AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com
#37

Qwen3.6 27B

Qwen リリース: 2026-04-20 テスト日時: 2026-04-27 21:31 qwen/qwen3.6-27b::medium
(medium) (none)

概要

Qwen3.6 27B は AI BENCHY で 7.9 を記録し、順位は #37 です。信頼性は 10.0、成功率は 77.8%、総コストは $0.043、平均応答時間は 25.56s です。

スコア

7.9

一貫性

8.5

信頼性

10.0

合計出力トークン

21,553

合計入力トークン

0

入力価格

$0.500 / 1M

出力価格

$2.000 / 1M

正解テスト

誤答テスト数: 2

試行ごとの合格率: 77.8%

不安定なテスト

1

不安定なテストは、実行間で結果が混在しています(少なくとも1回合格かつ1回失敗)。

応答時間(平均)

25.56s

応答時間(最大): 47.48s

応答時間(合計): 153.33s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#37 Qwen3.6 27B

medium
Cost
$0.009
Time
39.6s
Tokens
3,090 tok

実行履歴

テスト日時 スコア 信頼性 正解テスト 合計コスト 比較する
2026-06-04 13:21 新しいテストを追加 6.8 10.0 $0.444 比較する
2026-05-21 23:59 スイート変更 6.6 9.9 $0.272 比較する
2026-04-27 21:48 新しいテストを追加 7.0 10.0 $0.209 比較する
2026-04-27 21:31 最初に記録された実行 7.9 10.0 $0.043 現在の実行

実行比較

実行スコア一貫性信頼性正解テスト不安定なテスト合計出力トークン合計入力トークン合計コスト応答時間(平均)
2026-04-27 21:31 · 最初に記録された実行7.98.510.04/6121,5530$0.04325.56s
2026-05-21 23:59 · スイート変更6.68.19.99/205118,7040$0.27257.65s
差分+1.3+0.4+0.1-5-4-971510-$0.229-32096ms

この 2 つの実行では異なるベンチマークスイートが使われているため、差分にはモデル変化とスイート変化の両方が含まれます。

チャート

最初のモデルを選択し、次に2つ目のモデルをクリックして並列比較ページを開きます。

合計出力トークン

スコア vs 合計出力トークン

クイック比較

カテゴリ内訳

カテゴリ スコア 一貫性 正解テスト
反AIトリック 10.0 10.0
データ解析と抽出 4.3 1.2
ドメイン特化 3.0 10.0
指示追従 10.0 10.0
ツール呼び出し 10.0 10.0

比較対象モデル