AI BENCHY
Your ad here

#66

Qwen3.5-9B

Qwen ยท Rilis: 2026-03-02 ยท qwen/qwen3.5-9b::medium

Skor Rata-rata

2.6

Biaya per hasil

0.779

Konsistensi

7.4

Total Biaya

$0.024

Tes benar

Tes Salah: 13

Tingkat lulus per percobaan: 35.4%

Tes tidak stabil

5

Tes tidak stabil memiliki hasil campuran antar run (setidaknya satu lulus dan satu gagal).

Waktu respons (rata-rata)

71.44s

Waktu respons (maks): 226.38s

Waktu respons (total): 928.77s

Grafik

Pilih model pertama, lalu klik model kedua untuk membuka halaman berdampingan.

Total token output

Perbandingan Cepat

Rincian Kategori

Kategori Skor Rata-rata Konsistensi Tes benar
Trik anti-AI 4.0 7.2
Gabungan 10.0 10.0
Parsing dan ekstraksi data 5.0 5.6
Spesifik domain 10.0 7.2
Kecerdasan umum 10.0 1.6
Kepatuhan instruksi 5.5 5.8
Pemecahan teka-teki 10.0 10.0
Pemanggilan alat 10.0 10.0

Model yang Dibandingkan