AI BENCHY
Your ad here

Kegagalan kategori AI BENCHY

Kepatuhan instruksi: Kesalahan API

Kepatuhan instruksi
Kesalahan API

Lihat model AI mana yang paling mungkin mengalami Kesalahan API di Kepatuhan instruksi, agar Anda bisa menemukan titik lemahnya lebih cepat. Urutkan berdasarkan: Tes benar ↓.

Model yang ditampilkan

1

Total kegagalan

1

Model yang paling terdampak

Grok 4.20 1

Model teratas menurut Jumlah Kesalahan API

Jumlah Kesalahan API vs Skor

Model teratas menurut Waktu respons (rata-rata)

Model teratas menurut Perkiraan biaya terbuang