AI BENCHY
Advertise here

Kegagalan kategori AI BENCHY

Kecerdasan umum: Jawaban salah

Kecerdasan umum
Jawaban salah

Lihat model AI mana yang paling mungkin mengalami Jawaban salah di Kecerdasan umum, agar Anda bisa menemukan titik lemahnya lebih cepat.

Model yang ditampilkan

2

Total kegagalan

32

Model yang paling terdampak

Step 3.7 Flash 1
Peringkat Model Perusahaan Jumlah Jawaban salah Skor kategori Tes benar Waktu respons (rata-rata)
#158 GLM 4.7 Flash medium Z.ai 1 3.6 0/1 18.1s
#163 Granite 4.1 8B none IBM Granite 1 4.0 0/1 499ms

Model teratas menurut Jumlah Jawaban salah

Jumlah Jawaban salah vs Skor

Model teratas menurut Waktu respons (rata-rata)

Model teratas menurut Perkiraan biaya terbuang