AI BENCHY
Bandingkan Grafik Metodologi
❤️ Made by XCS
Your ad here

Kegagalan AI BENCHY

Kegagalan Kesalahan API

Lihat model AI mana yang paling sering mengalami Kesalahan API, agar Anda bisa melihat risiko keandalan sebelum memilih. Urutkan berdasarkan: Skor Rata-rata ↓.

Model yang ditampilkan

5

Total kegagalan

8

Model yang paling terdampak

MiMo-V2-Flash 1
Peringkat Model Perusahaan Jumlah Kesalahan API Skor Rata-rata Tes benar Waktu respons (rata-rata)
#21 MiMo-V2-Flash medium Xiaomi 1 7.2 11/16 25.3s
#24 Qwen3.5-Flash medium Qwen 1 6.9 10/16 70.8s
#35 Qwen3.5-35B-A3B medium Qwen 1 5.5 8/16 43.9s
#54 MiMo-V2-Flash none Xiaomi 1 2.9 3/16 2.97s
#55 LFM2-24B-A2B none Liquid 4 2.6 1/16 811ms

Model teratas menurut Jumlah Kesalahan API

Jumlah Kesalahan API vs skor rata-rata

Model teratas menurut Waktu respons (rata-rata)