AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

Kegagalan kategori AI BENCHY

Trik anti-AI: Jawaban salah

Trik anti-AI
Jawaban salah

Lihat model AI mana yang paling mungkin mengalami Jawaban salah di Trik anti-AI, agar Anda bisa menemukan titik lemahnya lebih cepat.

Model yang ditampilkan

5

Total kegagalan

245

Model yang paling terdampak

Gemini 2.5 Flash 4
Peringkat Model Perusahaan Jumlah Jawaban salah Skor kategori Tes benar Waktu respons (rata-rata)
#137 Elephant Alpha none Openrouter 1 6.6 2/4 963ms
#138 Ling-2.6-flash none Inclusionai 1 6.8 2/4 11.8s
#149 Nemotron 3 Nano Omni 30b A3b Reasoning medium NVIDIA 1 6.4 2/4 1.20s
#156 Hy3 preview none Tencent 1 4.8 1/4 11.1s
#161 Qwen3.5-9B medium Qwen 1 5.1 1/4 34.4s

Model teratas menurut Jumlah Jawaban salah

Jumlah Jawaban salah vs Skor

Model teratas menurut Waktu respons (rata-rata)

Model teratas menurut Perkiraan biaya terbuang