AI BENCHY
Bandingkan Grafik Metodologi
❤️ Made by XCS
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

Kegagalan kategori AI BENCHY

Trik anti-AI
Format tambahan

Lihat model AI mana yang paling mungkin mengalami Format tambahan di Trik anti-AI, agar Anda bisa menemukan titik lemahnya lebih cepat. Urutkan berdasarkan: Waktu respons (rata-rata) ↓.

Model yang ditampilkan

5

Total kegagalan

8

Model yang paling terdampak

Claude Opus 4.6 2
Peringkat Model Perusahaan Jumlah Format tambahan Skor kategori Tes benar Waktu respons (rata-rata)
#26 Claude Opus 4.6 medium Anthropic 2 4.0 1/3 11.9s
#33 DeepSeek V3.2 none DeepSeek 2 10.0 0/3 8.79s
#11 Claude Sonnet 4.6 medium Anthropic 1 7.0 2/3 4.95s
#25 Claude Sonnet 4.6 none Anthropic 2 4.0 1/3 4.83s
#48 Qwen3 Coder Next none Qwen 1 2.3 0/3 4.39s

Model teratas menurut Jumlah Format tambahan

Jumlah Format tambahan vs skor rata-rata

Model teratas menurut Waktu respons (rata-rata)

Model teratas menurut Perkiraan biaya terbuang