Kegagalan kategori AI BENCHY
Kecerdasan umum
Kedaluwarsa
Kecerdasan umum
Kedaluwarsa
Lihat model AI mana yang paling mungkin mengalami Kedaluwarsa di Kecerdasan umum, agar Anda bisa menemukan titik lemahnya lebih cepat. Urutkan berdasarkan: Tes benar ↓.
Alasan kegagalan terkait
Kategori terkait
| Peringkat | Model | Perusahaan | Jumlah Kedaluwarsa | Skor kategori | Tes benar | Waktu respons (rata-rata) |
|---|---|---|---|---|---|---|
| #4 | Qwen3.5 Plus 2026-02-15 medium | Qwen | 1 | 10.0 | 0/1 | 79.9s |
| #10 | Qwen3.5-122B-A10B medium | Qwen | 1 | 10.0 | 0/1 | 34.1s |
| #35 | Qwen3.5-35B-A3B medium | Qwen | 1 | 10.0 | 0/1 | 30.3s |