AI BENCHY
Advertise here

AI BENCHY श्रेणी अपयशे

अँटी-एआय युक्त्या: अतिरिक्त फॉरमॅटिंग

अँटी-एआय युक्त्या
अतिरिक्त फॉरमॅटिंग

अँटी-एआय युक्त्या मध्ये कोणत्या AI मॉडेल्सना अतिरिक्त फॉरमॅटिंग येण्याची शक्यता जास्त आहे ते पाहा, म्हणजे कमकुवत बाजू लवकर ओळखता येतील.

दाखवलेली मॉडेल्स

10

एकूण अपयशे

14

सर्वाधिक प्रभावित मॉडेल

Claude Opus 4.8 2
क्रमांक मॉडेल कंपनी अतिरिक्त फॉरमॅटिंग संख्या श्रेणी स्कोअर बरोबर चाचण्या प्रतिसाद वेळ (सरासरी)
#68 Claude Opus 4.8 none Anthropic 2 6.5 2/4 3.40s
#69 Claude Opus 4.6 medium Anthropic 2 6.4 2/4 7.45s
#77 Claude Sonnet 4.6 none Anthropic 2 4.8 1/4 2.94s
#133 DeepSeek V3.2 none DeepSeek 2 3.2 0/4 9.35s
#30 Qwen3.5-27B medium Qwen 1 8.7 3/4 19.8s
#47 Grok Build 0.1 medium X AI 1 8.3 3/4 7.43s
#52 Claude Sonnet 4.6 medium Anthropic 1 6.5 2/4 2.98s
#64 MiMo-V2-Flash medium Xiaomi 1 8.1 3/4 15.8s
#84 Grok 4.20 Multi Agent Beta medium X AI 1 6.9 2/4 3.46s
#140 Qwen3 Coder Next none Qwen 1 3.6 0/4 3.31s

अतिरिक्त फॉरमॅटिंग संख्या नुसार शीर्ष मॉडेल्स

अतिरिक्त फॉरमॅटिंग संख्या वि स्कोअर

प्रतिसाद वेळ (सरासरी) नुसार शीर्ष मॉडेल्स

अंदाजित वाया गेलेला खर्च नुसार शीर्ष मॉडेल्स