AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY श्रेणी अपयशे

अँटी-एआय युक्त्या: अतिरिक्त फॉरमॅटिंग

अँटी-एआय युक्त्या
अतिरिक्त फॉरमॅटिंग

अँटी-एआय युक्त्या मध्ये कोणत्या AI मॉडेल्सना अतिरिक्त फॉरमॅटिंग येण्याची शक्यता जास्त आहे ते पाहा, म्हणजे कमकुवत बाजू लवकर ओळखता येतील.

दाखवलेली मॉडेल्स

10

एकूण अपयशे

14

सर्वाधिक प्रभावित मॉडेल

Claude Opus 4.8 2
क्रमांक मॉडेल कंपनी अतिरिक्त फॉरमॅटिंग संख्या श्रेणी स्कोअर बरोबर चाचण्या प्रतिसाद वेळ (सरासरी)
#68 Claude Opus 4.8 none Anthropic 2 6.5 2/4 3.40s
#69 Claude Opus 4.6 medium Anthropic 2 6.4 2/4 7.45s
#77 Claude Sonnet 4.6 none Anthropic 2 4.8 1/4 2.94s
#133 DeepSeek V3.2 none DeepSeek 2 3.2 0/4 9.35s
#30 Qwen3.5-27B medium Qwen 1 8.7 3/4 19.8s
#47 Grok Build 0.1 medium X AI 1 8.3 3/4 7.43s
#52 Claude Sonnet 4.6 medium Anthropic 1 6.5 2/4 2.98s
#64 MiMo-V2-Flash medium Xiaomi 1 8.1 3/4 15.8s
#84 Grok 4.20 Multi Agent Beta medium X AI 1 6.9 2/4 3.46s
#140 Qwen3 Coder Next none Qwen 1 3.6 0/4 3.31s

अतिरिक्त फॉरमॅटिंग संख्या नुसार शीर्ष मॉडेल्स

अतिरिक्त फॉरमॅटिंग संख्या वि स्कोअर

प्रतिसाद वेळ (सरासरी) नुसार शीर्ष मॉडेल्स

अंदाजित वाया गेलेला खर्च नुसार शीर्ष मॉडेल्स