AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

Kegagalan AI BENCHY

Kegagalan Kesalahan API

Lihat model AI mana yang paling sering mengalami Kesalahan API, agar Anda bisa melihat risiko keandalan sebelum memilih. Urutkan berdasarkan: Tes benar ↓.

Model yang ditampilkan

3

Total kegagalan

27

Model yang paling terdampak

Gemini 3 PRO Preview 1
Peringkat Model Perusahaan Jumlah Kesalahan API Skor Tes benar Waktu respons (rata-rata)
#94 MiMo-V2-Flash none Xiaomi 1 4.5 3/18 2.79s
#98 LFM2-24B-A2B none Liquid 4 4.1 1/16 811ms
#99 Step 3.5 Flash none Stepfun 1 3.0 0/1 0ms

Model teratas menurut Jumlah Kesalahan API

Jumlah Kesalahan API vs Skor

Model teratas menurut Waktu respons (rata-rata)