#37

Qwen3.6 27B

Qwen Rilis: 2026-04-20 Diuji pada: 2026-04-27 21:31 qwen/qwen3.6-27b::medium

(medium) (none)

Ringkasan

Qwen3.6 27B mendapat skor 7.9 di AI BENCHY dan berada di peringkat #37. Model ini memiliki reliabilitas 10.0, tingkat keberhasilan 77.8%, total biaya $0.043, dan waktu respons rata-rata 25.56s.

Skor

7.9

Konsistensi

8.5

Keandalan

10.0

Total biaya (harga saat ini)

$0.043

Total token output

21,553

Total token input

Harga input

$0.500 / 1M

Harga output

$2.000 / 1M

Tes benar

Tes Salah: 2

Tingkat lulus per percobaan: 77.8%

Tes tidak stabil

Tes tidak stabil memiliki hasil campuran antar run (setidaknya satu lulus dan satu gagal).

Waktu respons (rata-rata)

25.56s

Waktu respons (maks): 47.48s

Waktu respons (total): 153.33s

Tidak ada jawaban: 1 Jawaban salah: 1

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#37 Qwen3.6 27B

medium

Cost: $0.009
Time: 39.6s
Tokens: 3,090 tok

Riwayat run

Diuji pada	Skor	Keandalan	Total Biaya	Bandingkan
2026-06-04 13:21 Tes baru ditambahkan	6.8	10.0	$0.444 ↑	Bandingkan
2026-05-21 23:59 Suite berubah	6.6	9.9	$0.272	Bandingkan
2026-04-27 21:48 Tes baru ditambahkan	7.0	10.0	$0.209	Bandingkan
2026-04-27 21:31 Run pertama yang tercatat	7.9	10.0	$0.043	Run saat ini

Perbandingan run

Run	Skor	Konsistensi	Keandalan	Tes benar	Tes tidak stabil	Total token output	Total Biaya	Waktu respons (rata-rata)
2026-04-27 21:31 · Run pertama yang tercatat	7.9	8.5	10.0	4/6	1	21,553	$0.043	25.56s
2026-05-21 23:59 · Suite berubah	6.6	8.1	9.9	9/20	5	118,704	$0.272	57.65s
Selisih	+1.3	+0.4	+0.1	-5	-4	-97151	-$0.229	-32096ms