AI BENCHY
তুলনা করুন চার্ট Poddhoti
❤️ Made by XCS
Your ad here

AI BENCHY ব্যর্থতা

অতিরিক্ত ফরম্যাটিং ব্যর্থতা

দেখুন কোন AI মডেলগুলো সবচেয়ে বেশি অতিরিক্ত ফরম্যাটিং সমস্যায় পড়ে, যাতে বেছে নেওয়ার আগে নির্ভরযোগ্যতার ঝুঁকি বুঝতে পারেন। সাজান: প্রতিক্রিয়া সময় (গড়) ↓.

দেখানো মডেল

6

মোট ব্যর্থতা

13

সবচেয়ে বেশি প্রভাবিত মডেল

Claude Opus 4.6 4
র‍্যাঙ্ক মডেল কোম্পানি অতিরিক্ত ফরম্যাটিং সংখ্যা গড় স্কোর সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়)
#26 Claude Opus 4.6 medium Anthropic 4 6.6 10/16 22.9s
#33 DeepSeek V3.2 none DeepSeek 2 5.5 7/16 12.9s
#48 Qwen3 Coder Next none Qwen 1 4.0 4/16 11.7s
#11 Claude Sonnet 4.6 medium Anthropic 2 7.7 12/16 11.2s
#25 Claude Sonnet 4.6 none Anthropic 3 6.8 10/16 5.57s
#54 MiMo-V2-Flash none Xiaomi 1 2.9 3/16 2.97s

অতিরিক্ত ফরম্যাটিং সংখ্যা অনুযায়ী শীর্ষ মডেল

অতিরিক্ত ফরম্যাটিং সংখ্যা বনাম গড় স্কোর

প্রতিক্রিয়া সময় (গড়) অনুযায়ী শীর্ষ মডেল