AI BENCHY
Advertise here

Kegagalan kategori AI BENCHY

Pemecahan teka-teki: Format tambahan

Pemecahan teka-teki
Format tambahan

Lihat model AI mana yang paling mungkin mengalami Format tambahan di Pemecahan teka-teki, agar Anda bisa menemukan titik lemahnya lebih cepat. Urutkan berdasarkan: Waktu respons (rata-rata) ↓.

Model yang ditampilkan

5

Total kegagalan

5

Model yang paling terdampak

DeepSeek V4 Flash 1
Peringkat Model Perusahaan Jumlah Format tambahan Skor kategori Tes benar Waktu respons (rata-rata)
#139 DeepSeek V4 Flash none DeepSeek 1 3.1 0/3 23.7s
#113 DeepSeek V4 Pro none DeepSeek 1 7.6 2/3 16.0s
#51 Mimo V2 PRO medium Xiaomi 1 6.4 1/3 5.08s
#68 Claude Opus 4.8 none Anthropic 1 7.7 2/3 2.74s
#77 Claude Sonnet 4.6 none Anthropic 1 7.7 2/3 2.53s

Model teratas menurut Jumlah Format tambahan

Jumlah Format tambahan vs Skor

Model teratas menurut Waktu respons (rata-rata)

Model teratas menurut Perkiraan biaya terbuang