AI BENCHY
Advertise here

Kegagalan kategori AI BENCHY

Kepatuhan instruksi: Tidak ada jawaban

Kepatuhan instruksi
Tidak ada jawaban

Lihat model AI mana yang paling mungkin mengalami Tidak ada jawaban di Kepatuhan instruksi, agar Anda bisa menemukan titik lemahnya lebih cepat. Urutkan berdasarkan: Tes benar ↓.

Model yang ditampilkan

2

Total kegagalan

2

Model yang paling terdampak

Gemini 3.1 Flash Lite 1

Model teratas menurut Jumlah Tidak ada jawaban

Jumlah Tidak ada jawaban vs Skor

Model teratas menurut Waktu respons (rata-rata)

Model teratas menurut Perkiraan biaya terbuang