AI BENCHY
Advertise here

Kegagalan kategori AI BENCHY

Trik anti-AI: Jawaban salah

Trik anti-AI
Jawaban salah

Lihat model AI mana yang paling mungkin mengalami Jawaban salah di Trik anti-AI, agar Anda bisa menemukan titik lemahnya lebih cepat.

Model yang ditampilkan

15

Total kegagalan

245

Model yang paling terdampak

Gemini 2.5 Flash 4
Peringkat Model Perusahaan Jumlah Jawaban salah Skor kategori Tes benar Waktu respons (rata-rata)
#111 Owl Alpha medium Openrouter 3 4.8 1/4 3.97s
#113 DeepSeek V4 Pro none DeepSeek 3 3.5 0/4 14.0s
#114 Qwen3.5 Plus 2026-04-20 none Qwen 3 4.8 1/4 1.88s
#115 Qwen3.5-27B none Qwen 3 4.8 1/4 788ms
#121 Owl Alpha none Openrouter 3 3.4 0/4 2.78s
#122 GLM 4.7 Flash none Z.ai 3 5.2 1/4 5.51s
#123 MiMo-V2.5-Pro none Xiaomi 3 3.3 0/4 2.67s
#124 Kimi K2.6 none Moonshot AI 3 4.6 1/4 1.39s
#127 Grok 4.20 none X AI 3 4.8 1/4 501ms
#131 Qwen3.5-122B-A10B none Qwen 3 4.8 1/4 1.59s
#132 Mistral Small 4 medium Mistral 3 5.6 1/4 2.67s
#141 Nemotron 3 Super none NVIDIA 3 4.8 1/4 4.46s
#145 Laguna M.1 none Poolside 3 3.4 0/4 705ms
#147 GPT-4o-mini none OpenAI 3 4.8 1/4 1.34s
#150 Qwen3 Coder Next medium Qwen 3 3.5 0/4 8.64s

Model teratas menurut Jumlah Jawaban salah

Jumlah Jawaban salah vs Skor

Model teratas menurut Waktu respons (rata-rata)

Model teratas menurut Perkiraan biaya terbuang