AI BENCHY
Advertise here

Kegagalan kategori AI BENCHY

Pemecahan teka-teki: Kedaluwarsa

Pemecahan teka-teki
Kedaluwarsa

Lihat model AI mana yang paling mungkin mengalami Kedaluwarsa di Pemecahan teka-teki, agar Anda bisa menemukan titik lemahnya lebih cepat. Urutkan berdasarkan: Waktu respons (rata-rata) ↑.

Model yang ditampilkan

4

Total kegagalan

5

Model yang paling terdampak

MiniMax M2.5 1
Peringkat Model Perusahaan Jumlah Kedaluwarsa Skor kategori Tes benar Waktu respons (rata-rata)
#129 MiniMax M2.5 medium Minimax 1 5.3 1/3 11.2s
#49 Qwen3.5-Flash medium Qwen 1 8.2 2/3 27.6s
#161 Qwen3.5-9B medium Qwen 2 3.0 0/3 32.3s
#66 Qwen3.5-35B-A3B medium Qwen 1 8.2 2/3 33.1s

Model teratas menurut Jumlah Kedaluwarsa

Jumlah Kedaluwarsa vs Skor

Model teratas menurut Waktu respons (rata-rata)

Model teratas menurut Perkiraan biaya terbuang