AI BENCHY
Your ad here

Kegagalan AI BENCHY

Kegagalan Kesalahan API

Lihat model AI mana yang paling sering mengalami Kesalahan API, agar Anda bisa melihat risiko keandalan sebelum memilih. Urutkan berdasarkan: Tes benar ↑.

Model yang ditampilkan

3

Total kegagalan

27

Model yang paling terdampak

Step 3.5 Flash 1
Peringkat Model Perusahaan Jumlah Kesalahan API Skor Tes benar Waktu respons (rata-rata)
#14 Gemma 4 31B medium Google 2 8.3 13/18 24.9s
#20 Qwen3.6 Plus medium Qwen 1 8.1 13/18 15.3s
#12 Gemini 3 PRO Preview medium Google 1 8.4 14/18 9.06s

Model teratas menurut Jumlah Kesalahan API

Jumlah Kesalahan API vs Skor

Model teratas menurut Waktu respons (rata-rata)