AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

Kegagalan kategori AI BENCHY

Pengetahuan umum: Jawaban salah

Pengetahuan umum
Jawaban salah

Lihat model AI mana yang paling mungkin mengalami Jawaban salah di Pengetahuan umum, agar Anda bisa menemukan titik lemahnya lebih cepat. Urutkan berdasarkan: Waktu respons (rata-rata) ↑.

Model yang ditampilkan

15

Total kegagalan

133

Model yang paling terdampak

Qwen3.5-122B-A10B 1
133/133
Peringkat Model Perusahaan Jumlah Jawaban salah Skor kategori Total Biaya Tes benar Waktu respons (rata-rata)

Model teratas menurut Jumlah Jawaban salah

Jumlah Jawaban salah vs Skor

Model teratas menurut Waktu respons (rata-rata)

Model teratas menurut Perkiraan biaya terbuang