AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

#37

Qwen3.6 27B

Qwen リリース: 2026-04-20 テスト日時: 2026-04-27 21:31 qwen/qwen3.6-27b::medium
(medium) (none)

スコア

7.9

一貫性

8.5

信頼性

10.0

合計出力トークン

21,553

????

$0.500 / 1M

????

$2.000 / 1M

正解テスト

誤答テスト数: 2

試行ごとの合格率: 77.8%

不安定なテスト

1

不安定なテストは、実行間で結果が混在しています(少なくとも1回合格かつ1回失敗)。

応答時間(平均)

25.56s

応答時間(最大): 47.48s

応答時間(合計): 153.33s

実行履歴

テスト日時 スコア 信頼性 正解テスト 合計コスト 比較する
2026-04-27 21:48 新しいテストを追加 7.0 10.0 $0.209 比較する
2026-04-27 21:31 最初に記録された実行 7.9 10.0 $0.043 現在の実行

チャート

最初のモデルを選択し、次に2つ目のモデルをクリックして並列比較ページを開きます。

合計出力トークン

スコア vs 合計出力トークン

クイック比較

カテゴリ内訳

カテゴリ スコア 一貫性 正解テスト
反AIトリック 10.0 10.0
データ解析と抽出 4.3 1.2
ドメイン特化 3.0 10.0
指示追従 10.0 10.0
ツール呼び出し 10.0 10.0

比較対象モデル