#20

Qwen3.5-122B-A10B

Qwen Rilis: 2026-02-24 Diuji pada: 2026-04-11 01:44 qwen/qwen3.5-122b-a10b::medium

(medium) (none)

Ringkasan

Qwen3.5-122B-A10B mendapat skor 8.1 di AI BENCHY dan berada di peringkat #20. Model ini memiliki reliabilitas T/A, tingkat keberhasilan 79.6%, total biaya $0.528, dan waktu respons rata-rata 31.38s.

Yang membuat Qwen3.5-122B-A10B unik: Model ini memakai token reasoning yang sangat tinggi, yang bisa menjelaskan run yang lebih lambat atau lebih mahal.

Skor

8.1

Konsistensi

8.6

Keandalan

T/A

Total biaya (harga saat ini)

$0.528

Total token output

180,303

Total token input

Harga input

$0.260 / 1M

Harga output

$2.080 / 1M

Tes benar

Tes Salah: 5

Tingkat lulus per percobaan: 79.6%

Tes tidak stabil

Tes tidak stabil memiliki hasil campuran antar run (setidaknya satu lulus dan satu gagal).

Waktu respons (rata-rata)

31.38s

Waktu respons (maks): 119.29s

Waktu respons (total): 564.84s

Jawaban salah: 3 Kedaluwarsa: 2

Showcase generasi

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#20 Qwen3.5-122B-A10B

medium

Biaya: $0.019
Waktu: 48.7s
Token: 6,034 tok

Riwayat run

Diuji pada	Skor	Keandalan	Total Biaya	Bandingkan
2026-06-04 13:31 Tes baru ditambahkan	7.8	10.0	$0.588 ↓	Bandingkan
2026-05-22 00:03 Suite berubah	7.7	10.0	$0.650	Bandingkan
2026-04-11 01:44 Run pertama yang tercatat	8.1	T/A	$0.528	Run saat ini

Grafik

Pilih model pertama, lalu klik model kedua untuk membuka halaman berdampingan.

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Perbandingan Cepat

Qwen3.5-122B-A10BmediumvsGemini 3.1 Flash Litemedium Qwen3.5-122B-A10BmediumvsQwen3.5 Plus 2026-04-20medium Qwen3.5-122B-A10BmediumvsClaude Opus 4.8low Qwen3.5-122B-A10BmediumvsGemini 3.1 Flash Lite Previewmedium Qwen3.5-122B-A10BmediumvsGrok 4.3medium Qwen3.5-122B-A10BmediumvsGemini 3.5 Flashhigh Qwen3.5-122B-A10BmediumvsGemini 3 Flash Previewmedium Qwen3.5-122B-A10BmediumvsNemotron 3 Ultra 550b A55bmediumTersedia gratis Qwen3.5-122B-A10BmediumvsGPT-5.5low

Rincian Kategori

Kategori	Skor	Konsistensi
Trik anti-AI	10.0	10.0
Pemrograman	4.7	1.6
Gabungan	10.0	10.0
Parsing dan ekstraksi data	10.0	10.0
Spesifik domain	2.9	7.2
Kecerdasan umum	3.4	2.2
Kepatuhan instruksi	10.0	10.0
Pemecahan teka-teki	10.0	10.0
Pemanggilan alat	10.0	10.0

Qwen3.5-122B-A10B

Hamster playing table tennis

#20 Qwen3.5-122B-A10B

Grafik

Model teratas berdasarkan skor

Skor vs Total Biaya

Waktu respons (rata-rata)

Skor vs Waktu respons (rata-rata)

Total token output

Skor vs Total token output

Perbandingan Cepat

Rincian Kategori

Model yang Dibandingkan