Kegagalan kategori AI BENCHY
Trik anti-AI: Jawaban salah
Trik anti-AI
Jawaban salah
Lihat model AI mana yang paling mungkin mengalami Jawaban salah di Trik anti-AI, agar Anda bisa menemukan titik lemahnya lebih cepat.
Alasan kegagalan
| Peringkat | Model | Perusahaan | Jumlah Jawaban salah | Skor kategori | Tes benar | Waktu respons (rata-rata) |
|---|---|---|---|---|---|---|
| #137 | Elephant Alpha none | Openrouter | 1 | 6.6 | 2/4 | 963ms |
| #138 | Ling-2.6-flash none | Inclusionai | 1 | 6.8 | 2/4 | 11.8s |
| #149 | Nemotron 3 Nano Omni 30b A3b Reasoning medium | NVIDIA | 1 | 6.4 | 2/4 | 1.20s |
| #156 | Hy3 preview none | Tencent | 1 | 4.8 | 1/4 | 11.1s |
| #161 | Qwen3.5-9B medium | Qwen | 1 | 5.1 | 1/4 | 34.4s |