#98

Qwen3.5-9B

Qwen Rilis: 2026-03-02 Diuji pada: 2026-04-20 17:48 qwen/qwen3.5-9b::none

(medium) (none)

Ringkasan

Qwen3.5-9B mendapat skor 4.8 di AI BENCHY dan berada di peringkat #98. Model ini memiliki reliabilitas T/A, tingkat keberhasilan 24.1%, total biaya $0.005, dan waktu respons rata-rata 1.47s.

Yang membuat Qwen3.5-9B unik: Total biaya benchmark-nya sangat rendah untuk kisaran skornya. Model ini terasa cepat dibandingkan model serupa.

Skor

4.8

Konsistensi

9.6

Keandalan

T/A

Total biaya (harga saat ini)

$0.005

Total token output

3,951

Total token input

Harga input

$0.100 / 1M

Harga output

$0.150 / 1M

Tes benar

Tes Salah: 14

Tingkat lulus per percobaan: 24.1%

Tes tidak stabil

Tes tidak stabil memiliki hasil campuran antar run (setidaknya satu lulus dan satu gagal).

Waktu respons (rata-rata)

1.47s

Waktu respons (maks): 5.91s

Waktu respons (total): 26.43s

Jawaban salah: 10 Tidak mengikuti instruksi: 3 Pemanggilan alat tidak valid: 1

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#98 Qwen3.5-9B

none

SVG tidak valid

Biaya: $0.000
Waktu: 300.0s
Token: 0 tok

Riwayat run

Diuji pada	Skor	Keandalan	Total Biaya	Bandingkan
2026-07-16 22:25 Tes baru ditambahkan	5.1	10.0	$0.021 ↑	Bandingkan
2026-06-04 13:30 Tes baru ditambahkan	4.6	10.0	$0.003 ↓	Bandingkan
2026-05-22 00:02 Suite berubah	4.6	10.0	$0.005	Bandingkan
2026-05-08 13:28 Suite berubah	4.7	10.0	$0.005	Bandingkan
2026-05-08 13:28 Suite berubah	4.7	10.0	$0.005	Bandingkan
2026-04-20 17:48 Run pertama yang tercatat	4.8	T/A	$0.005	Run saat ini

Grafik

Pilih model pertama, lalu klik model kedua untuk membuka halaman berdampingan.

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Perbandingan Cepat

Qwen3.5-9BnonevsMiMo-V2.5none Qwen3.5-9BnonevsNorth Mini CodenoneTersedia gratis Qwen3.5-9BnonevsMistral Small 4medium Qwen3.5-9BnonevsMiniMax M2.7medium Qwen3.5-9BnonevsQwen3 Coder Nextnone Qwen3.5-9BnonevsLaguna S 2.1lowTersedia gratis Qwen3.5-9BnonevsMistral Small 4none Qwen3.5-9BnonevsDeepSeek V3.2none Qwen3.5-9BnonevsInklingnone Qwen3.5-9BnonevsGPT-4o-mininone

Rincian Kategori

Kategori	Skor	Konsistensi
Trik anti-AI	3.1	9.9
Pemrograman	5.2	3.4
Gabungan	3.0	10.0
Parsing dan ekstraksi data	10.0	10.0
Spesifik domain	3.0	10.0
Kecerdasan umum	4.4	9.9
Kepatuhan instruksi	6.5	10.0
Pemecahan teka-teki	3.2	9.9
Pemanggilan alat	10.0	10.0

Qwen3.5-9B

Hamster playing table tennis

#98 Qwen3.5-9B

Grafik

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Perbandingan Cepat

Rincian Kategori

Model yang Dibandingkan