Kegagalan AI BENCHY
Kegagalan Kedaluwarsa
Lihat model AI mana yang paling sering mengalami Kedaluwarsa, agar Anda bisa melihat risiko keandalan sebelum memilih. Urutkan berdasarkan: Tes benar ↓.
| Peringkat | Model | Perusahaan | Jumlah Kedaluwarsa | Skor | Tes benar | Waktu respons (rata-rata) |
|---|---|---|---|---|---|---|
| #130 | MiniMax M2.7 medium | Minimax | 2 | 5.3 | 5/21 | 38.2s |
| #150 | Qwen3 Coder Next medium | Qwen | 1 | 4.6 | 4/21 | 8.58s |
| #158 | GLM 4.7 Flash medium | Z.ai | 2 | 4.4 | 4/21 | 35.1s |
| #161 | Qwen3.5-9B medium | Qwen | 11 | 4.2 | 3/21 | 82.2s |