AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

Kegagalan kategori AI BENCHY

Pemecahan teka-teki: Format tambahan

Pemecahan teka-teki
Format tambahan

Lihat model AI mana yang paling mungkin mengalami Format tambahan di Pemecahan teka-teki, agar Anda bisa menemukan titik lemahnya lebih cepat. Urutkan berdasarkan: Tes benar ↓.

Model yang ditampilkan

2

Total kegagalan

2

Model yang paling terdampak

Claude Sonnet 4.6 1
Peringkat Model Perusahaan Jumlah Format tambahan Skor kategori Tes benar Waktu respons (rata-rata)
#42 Claude Sonnet 4.6 none Anthropic 1 7.7 2/3 2.92s
#23 MiMo-V2-Pro medium Xiaomi 1 7.0 1/3 4.71s

Model teratas menurut Jumlah Format tambahan

Jumlah Format tambahan vs Skor

Model teratas menurut Waktu respons (rata-rata)

Model teratas menurut Perkiraan biaya terbuang