AI BENCHY
Advertise here

Kegagalan AI BENCHY

Kegagalan Format tambahan

Lihat model AI mana yang paling sering mengalami Format tambahan, agar Anda bisa melihat risiko keandalan sebelum memilih. Urutkan berdasarkan: Total Biaya ↓.

Model yang ditampilkan

2

Total kegagalan

53

Model yang paling terdampak

Grok 4.20 Multi Agent Beta 2
32/32
Peringkat Model Perusahaan Jumlah Format tambahan Skor Total Biaya Tes benar Waktu respons (rata-rata)

Model teratas menurut Jumlah Format tambahan

Jumlah Format tambahan vs Skor

Model teratas menurut Waktu respons (rata-rata)