#54

Qwen3.5 Plus 2026-02-15

Qwen Rilis: 2026-02-15 Diuji pada: 2026-04-11 01:19 qwen/qwen3.5-plus-02-15::none

(medium) (none)

Ringkasan

Qwen3.5 Plus 2026-02-15 mendapat skor 6.8 di AI BENCHY dan berada di peringkat #54. Model ini memiliki reliabilitas T/A, tingkat keberhasilan 53.7%, total biaya $0.017, dan waktu respons rata-rata 2.60s.

Yang membuat Qwen3.5 Plus 2026-02-15 unik: Model ini paling menonjol di Pemrograman, dengan peringkat #1, sementara Gabungan adalah area terlemahnya di #13. Total biaya benchmark-nya sangat rendah untuk kisaran skornya. Model ini terasa cepat dibandingkan model serupa.

Skor

6.8

Konsistensi

9.3

Keandalan

T/A

Total biaya (harga saat ini)

$0.017

Total token output

2,461

Total token input

Harga input

$0.260 / 1M

Harga output

$1.560 / 1M

Tes benar

Tes Salah: 9

Tingkat lulus per percobaan: 53.7%

Tes tidak stabil

Tes tidak stabil memiliki hasil campuran antar run (setidaknya satu lulus dan satu gagal).

Waktu respons (rata-rata)

2.60s

Waktu respons (maks): 6.65s

Waktu respons (total): 31.23s

Jawaban salah: 9

Showcase generasi

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#54 Qwen3.5 Plus 2026-02-15

none

Biaya: $0.012
Waktu: 153.2s
Token: 7,787 tok

Riwayat run

Diuji pada	Skor	Keandalan	Total Biaya	Bandingkan
2026-06-04 13:10 Tes baru ditambahkan	6.3	10.0	$0.016 ↓	Bandingkan
2026-05-21 23:45 Suite berubah	6.4	10.0	$0.018	Bandingkan
2026-04-11 01:19 Run pertama yang tercatat	6.8	T/A	$0.017	Run saat ini

Grafik

Pilih model pertama, lalu klik model kedua untuk membuka halaman berdampingan.

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Perbandingan Cepat

Qwen3.5 Plus 2026-02-15nonevsGemini 2.5 Flashnone Qwen3.5 Plus 2026-02-15nonevsGPT-5.5none Qwen3.5 Plus 2026-02-15nonevsGemini 3.1 Flash Liteminimal Qwen3.5 Plus 2026-02-15nonevsQwen3.5-35B-A3Bmedium Qwen3.5 Plus 2026-02-15nonevsGemini 3.5 Flashhigh Qwen3.5 Plus 2026-02-15nonevsGemini 3 Flash Previewmedium Qwen3.5 Plus 2026-02-15nonevsNemotron 3 Ultra 550b A55bmediumTersedia gratis Qwen3.5 Plus 2026-02-15nonevsGPT-5.5low

Rincian Kategori

Kategori	Skor	Konsistensi
Trik anti-AI	4.8	10.0
Pemrograman	6.3	3.7
Gabungan	3.0	10.0
Parsing dan ekstraksi data	10.0	10.0
Spesifik domain	5.3	10.0
Kecerdasan umum	4.4	3.0
Kepatuhan instruksi	10.0	10.0
Pemecahan teka-teki	7.7	10.0
Pemanggilan alat	10.0	10.0

Qwen3.5 Plus 2026-02-15

Hamster playing table tennis

#54 Qwen3.5 Plus 2026-02-15

Grafik

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Perbandingan Cepat

Rincian Kategori

Model yang Dibandingkan