#88

Qwen3.5 Plus 2026-04-20

Qwen Rilis: 2026-04-20 Diuji pada: 2026-04-27 23:05 qwen/qwen3.5-plus-20260420::none

(medium) (none)

Ringkasan

Qwen3.5 Plus 2026-04-20 mendapat skor 5.8 di AI BENCHY dan berada di peringkat #88. Model ini memiliki reliabilitas 9.8, tingkat keberhasilan 42.6%, total biaya $0.024, dan waktu respons rata-rata 3.18s.

Yang membuat Qwen3.5 Plus 2026-04-20 unik: Model ini paling menonjol di Spesifik domain, dengan peringkat #3, sementara Gabungan adalah area terlemahnya di #18. Total biaya benchmark-nya sangat rendah untuk kisaran skornya.

Skor

5.8

Konsistensi

8.3

Keandalan

9.8

Total biaya (harga saat ini)

$0.024

Total token output

4,645

Total token input

Harga input

$0.400 / 1M

Harga output

$2.400 / 1M

Tes benar

Tes Salah: 12

Tingkat lulus per percobaan: 42.6%

Tes tidak stabil

Tes tidak stabil memiliki hasil campuran antar run (setidaknya satu lulus dan satu gagal).

Waktu respons (rata-rata)

3.18s

Waktu respons (maks): 13.32s

Waktu respons (total): 57.24s

Jawaban salah: 10 Tidak mengikuti instruksi: 2

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#88 Qwen3.5 Plus 2026-04-20

none

Biaya: $0.008
Waktu: 77.0s
Token: 4,369 tok

Riwayat run

Diuji pada	Skor	Keandalan	Total Biaya	Bandingkan
2026-07-16 21:27 Tes baru ditambahkan	6.1	10.0	$0.122 ↓	Bandingkan
2026-06-04 13:10 Tes baru ditambahkan	5.7	10.0	$0.032 ↓	Bandingkan
2026-05-21 23:47 Suite berubah	5.8	9.9	$0.041	Bandingkan
2026-05-08 13:10 Suite berubah	5.9	9.9	$0.040	Bandingkan
2026-05-08 13:10 Suite berubah	5.9	9.9	$0.040	Bandingkan
2026-04-27 23:05 Run awal	5.8	9.8	$0.024	Run saat ini

Grafik

Pilih model pertama, lalu klik model kedua untuk membuka halaman berdampingan.

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Perbandingan Cepat

Qwen3.5 Plus 2026-04-20nonevsQwen3.5-Flashnone Qwen3.5 Plus 2026-04-20nonevsQwen3.5-35B-A3Bnone Qwen3.5 Plus 2026-04-20nonevsQwen3.6 Flashnone Qwen3.5 Plus 2026-04-20nonevsGPT-5 Nanomedium Qwen3.5 Plus 2026-04-20nonevsInklinglow Qwen3.5 Plus 2026-04-20nonevsNemotron 3 UltranoneTersedia gratis Qwen3.5 Plus 2026-04-20nonevsGemini 3.1 Flash Litenone Qwen3.5 Plus 2026-04-20nonevsStep 3.5 Flashmedium Qwen3.5 Plus 2026-04-20nonevsgpt-oss-120bmedium Qwen3.5 Plus 2026-04-20nonevsGPT-5.6 Terranone

Rincian Kategori

Kategori	Skor	Konsistensi
Trik anti-AI	4.8	10.0
Pemrograman	5.3	3.4
Gabungan	2.8	1.6
Parsing dan ekstraksi data	10.0	10.0
Spesifik domain	5.3	10.0
Kecerdasan umum	4.8	10.0
Kepatuhan instruksi	6.2	5.8
Pemecahan teka-teki	4.8	7.9
Pemanggilan alat	10.0	10.0

Qwen3.5 Plus 2026-04-20

Hamster playing table tennis

#88 Qwen3.5 Plus 2026-04-20

Grafik

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Perbandingan Cepat

Rincian Kategori

Model yang Dibandingkan