AI BENCHY
Your ad here

Kegagalan kategori AI BENCHY

Gabungan: Jawaban salah

Gabungan
Jawaban salah

Lihat model AI mana yang paling mungkin mengalami Jawaban salah di Gabungan, agar Anda bisa menemukan titik lemahnya lebih cepat.

Model yang ditampilkan

15

Total kegagalan

37

Model yang paling terdampak

Gemini 3 Flash Preview 1
Peringkat Model Perusahaan Jumlah Jawaban salah Skor kategori Tes benar Waktu respons (rata-rata)
#5 Gemini 3 Flash Preview low Google 1 3.0 0/1 3.27s
#12 Gemini 3 PRO Preview medium Google 1 3.0 0/1 10.4s
#21 Gemini 3 Flash Preview none Google 1 4.7 0/1 3.56s
#22 Gemini 3.1 Flash Lite Preview low Google 1 3.0 0/1 11.9s
#23 MiMo-V2-Pro medium Xiaomi 1 4.7 0/1 64.7s
#29 Gemini 3.1 Flash Lite Preview none Google 1 3.0 0/1 3.20s
#49 Qwen3.5 Plus 2026-02-15 none Qwen 1 3.0 0/1 6.65s
#53 GLM 5 none Z.ai 1 3.0 0/1 4.98s
#55 MiMo-V2-Omni none Xiaomi 1 3.0 0/1 2.47s
#58 GLM 5V Turbo none Z.ai 1 3.0 0/1 6.51s
#59 Qwen3.5-Flash none Qwen 1 3.0 0/1 6.22s
#60 Gemma 4 26B A4B none Google 1 3.0 0/1 30.5s
#61 Seed-2.0-Lite none Bytedance Seed 1 3.0 0/1 6.59s
#62 Gemini 2.5 Flash none Google 1 3.0 0/1 4.39s
#63 Qwen3.5-35B-A3B none Qwen 1 3.0 0/1 47.4s

Model teratas menurut Jumlah Jawaban salah

Jumlah Jawaban salah vs Skor

Model teratas menurut Waktu respons (rata-rata)

Model teratas menurut Perkiraan biaya terbuang