AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

Kegagalan kategori AI BENCHY

Parsing dan ekstraksi data: Format tambahan

Parsing dan ekstraksi data
Format tambahan

Lihat model AI mana yang paling mungkin mengalami Format tambahan di Parsing dan ekstraksi data, agar Anda bisa menemukan titik lemahnya lebih cepat. Urutkan berdasarkan: Waktu respons (rata-rata) ↓.

Model yang ditampilkan

4

Total kegagalan

4

Model yang paling terdampak

Qwen3.5-9B 1
Peringkat Model Perusahaan Jumlah Format tambahan Skor kategori Tes benar Waktu respons (rata-rata)
#161 Qwen3.5-9B medium Qwen 1 3.6 0/2 87.3s
#152 MiMo-V2-Flash none Xiaomi 1 2.9 0/2 19.7s
#56 MiMo-V2.5 medium Xiaomi 1 2.7 0/2 6.33s
#143 MiMo-V2.5 none Xiaomi 1 6.5 1/2 1.01s

Model teratas menurut Jumlah Format tambahan

Jumlah Format tambahan vs Skor

Model teratas menurut Waktu respons (rata-rata)

Model teratas menurut Perkiraan biaya terbuang