AI BENCHY
Bandingkan Grafik
โค๏ธ XCS
Your ad here

#22

Qwen: Qwen3.5-35B-A3B

Qwen ยท qwen/qwen3.5-35b-a3b::medium

Buka pemilih perbandingan model

Skor Rata-rata

5.93

Biaya per hasil

5.169

Konsistensi

6.62

Total Biaya

$0.362

Tes benar

7/14

Tes dianggap lulus penuh hanya jika semua run-nya lulus.

Tes Salah

7

Tingkat lulus per percobaan: 73.8%

Tes tidak stabil

6

Waktu respons: rata-rata 44.87s ยท total 628.19s ยท maks 106.00s

Tidak mengikuti instruksi: 2 Kedaluwarsa: 2 Jawaban salah: 2 Kesalahan API: 1

Model teratas berdasarkan skor

Pilih model pertama, lalu klik model kedua untuk membuka halaman berdampingan.

Rincian Kategori

Kategori Skor Rata-rata Konsistensi Tes benar
Anti-AI Tricks 10.00 10.00 3/3
Data parsing and extraction 5.50 5.87 1/2
Domain specific 1.00 4.42 0/3
Instructions following 8.00 6.80 1/2
Puzzle Solving 4.34 4.70 1/3
Tool Calling 10.00 10.00 1/1