#37

Qwen3.6 27B

Qwen リリース: 2026-04-20 テスト日時: 2026-04-27 21:31 qwen/qwen3.6-27b::medium

(medium) (none)

概要

Qwen3.6 27B は AI BENCHY で 7.9 を記録し、順位は #37 です。信頼性は 10.0、成功率は 77.8%、総コストは $0.043、平均応答時間は 25.56s です。

Qwen3.6 27B の特徴: このスコア帯としては benchmark 総コストがかなり低めです。

7.9

一貫性

8.5

10.0

$0.043

合計出力トークン

21,553

合計入力トークン

入力価格

$0.500 / 1M

出力価格

$2.000 / 1M

誤答テスト数: 2

試行ごとの合格率: 77.8%

不安定なテスト

不安定なテストは、実行間で結果が混在しています（少なくとも1回合格かつ1回失敗）。

25.56s

応答時間（最大）: 47.48s

応答時間（合計）: 153.33s

回答なし: 1 不正解: 1

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

medium

実行履歴

テスト日時	スコア	信頼性	合計コスト	比較する
2026-07-16 22:13 新しいテストを追加	6.5	10.0	$0.779 ↑	比較する
2026-06-04 13:21 新しいテストを追加	6.8	10.0	$0.444 ↑	比較する
2026-05-21 23:59 スイート変更	6.6	9.9	$0.272	比較する
2026-04-27 21:48 新しいテストを追加	7.0	10.0	$0.209	比較する
2026-04-27 21:31 最初に記録された実行	7.9	10.0	$0.043	現在の実行

実行比較

実行	スコア	一貫性	信頼性	正解テスト	不安定なテスト	合計出力トークン	合計コスト	応答時間（平均）
2026-04-27 21:31 · 最初に記録された実行	7.9	8.5	10.0	4/6	1	21,553	$0.043	25.56s
2026-05-21 23:59 · スイート変更	6.6	8.1	9.9	9/20	5	118,704	$0.272	57.65s
差分	+1.3	+0.4	+0.1	-5	-4	-97151	-$0.229	-32096ms