AI BENCHY
Your ad here

#24

Grok 4.20 Beta

X AI · প্রকাশ: 2026-03-12 · x-ai/grok-4.20-beta::medium

প্রতি ফলাফলে খরচ

5.989

ধারাবাহিকতা

9.0

সঠিক টেস্ট

ভুল টেস্ট: 6

প্রতি চেষ্টায় পাস রেট: 70.8%

অস্থির টেস্ট

2

অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।

প্রতিক্রিয়া সময় (গড়)

8.89s

প্রতিক্রিয়া সময় (সর্বোচ্চ): 24.21s

প্রতিক্রিয়া সময় (মোট): 142.18s

চার্ট

প্রথম মডেলটি নির্বাচন করুন, তারপর দ্বিতীয় মডেলে ক্লিক করে পাশাপাশি তুলনা পৃষ্ঠা খুলুন।

মোট আউটপুট টোকেন

গড় স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

বিভাগভিত্তিক বিশ্লেষণ

বিভাগ গড় স্কোর ধারাবাহিকতা সঠিক টেস্ট
অ্যান্টি-এআই কৌশল 7.0 7.2
সমন্বিত 10.0 10.0
ডেটা পার্সিং ও নিষ্কাশন 9.9 10.0
ডোমেইন-নির্দিষ্ট 4.0 10.0
Sadharon Buddhimotta 10.0 10.0
নির্দেশনা অনুসরণ 9.0 10.0
ধাঁধা সমাধান 7.0 7.2
টুল কলিং 10.0 10.0

তুলনা করা মডেল