নেভিগেশন
AI BENCHY
Your ad here

AI BENCHY Compare

Inception: Mercury 2 vs xAI: Grok 4.20 Beta

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-03-12

মেট্রিক Mercury 2 Mercury 2 medium প্রকাশ: 2026-02-24 Grok 4.20 Beta Grok 4.20 Beta none প্রকাশ: 2026-03-12
র‍্যাঙ্ক #40 #52
গড় স্কোর 5.3 4.4
ধারাবাহিকতা 8.4 9.1
প্রতি ফলাফলে খরচ 0.631 2.214
মোট খরচ $0.045 $0.089
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 54.2% 33.3%
অস্থির টেস্ট 3 2
মোট রান 48 48
আউটপুট টোকেন 3,708 1,511
রিজনিং টোকেন 45,921 0
প্রতিক্রিয়া সময় (গড়) 2.36s 1.22s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 14.63s 6.48s
প্রতিক্রিয়া সময় (মোট) 35.39s 19.53s

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

গড় স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

গড় স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 7.3 9.8 66.7% 0 1.30s 2,531 2,410
Grok 4.20 Beta 3.3 7.9 22.2% 1 562ms 245 0
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 10.0 10.0 100.0% 0 3.28s 268 4,887
Grok 4.20 Beta 10.0 10.0 0.0% 0 6.48s 282 0
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 5.5 5.9 83.3% 1 1.11s 183 1,656
Grok 4.20 Beta 9.9 10.0 100.0% 0 601ms 197 0
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 10.0 7.2 11.1% 1 6.48s 41 30,754
Grok 4.20 Beta 10.0 10.0 0.0% 0 611ms 160 0
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 4.0 10.0 0.0% 0 821ms 137 542
Grok 4.20 Beta 5.0 10.0 0.0% 0 541ms 87 0
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 10.0 10.0 100.0% 0 1.07s 14 958
Grok 4.20 Beta 4.5 10.0 0.0% 0 687ms 60 0
Puzzle Solving স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 1.7 7.5 22.2% 1 934ms 354 2,758
Grok 4.20 Beta 4.0 7.2 55.6% 1 541ms 291 0
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 10.0 10.0 100.0% 0 1.89s 180 1,956
Grok 4.20 Beta 10.0 10.0 100.0% 0 4.79s 189 0

দ্রুত তুলনা

তুলনার জুটি বদলান