AI BENCHY
Advertise here

Kegagalan AI BENCHY

Kegagalan Format tambahan

Lihat model AI mana yang paling sering mengalami Format tambahan, agar Anda bisa melihat risiko keandalan sebelum memilih.

Model yang ditampilkan

15

Total kegagalan

49

Model yang paling terdampak

Claude Opus 4.6 5
30/30
Peringkat Model Perusahaan Jumlah Format tambahan Skor Total Biaya Tes benar Waktu respons (rata-rata)

Model teratas menurut Jumlah Format tambahan

Jumlah Format tambahan vs Skor

Model teratas menurut Waktu respons (rata-rata)