নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Inception: Mercury 2 vs xAI: Grok 4.20

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-04-16

মেট্রিক Mercury 2 Mercury 2 none প্রকাশ: 2026-02-24 Grok 4.20 Grok 4.20 none প্রকাশ: 2026-03-31
স্কোর 4.8 5.2
র‍্যাঙ্ক #89 #80
ধারাবাহিকতা 9.0 9.5
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 27.8% 29.6%
অস্থির টেস্ট 2 1
মোট রান 54 54
প্রতি ফলাফলে খরচ 0.165 1.889
মোট খরচ $0.007 $0.095
???? ??? $0.250 / 1M $2.000 / 1M
????? ??? $0.750 / 1M $6.000 / 1M
আউটপুট টোকেন 1,625 1,967
রিজনিং টোকেন 0 0
প্রতিক্রিয়া সময় (গড়) 613ms 1.11s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 1.27s 6.04s
প্রতিক্রিয়া সময় (মোট) 11.04s 20.02s

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 3.0 10.0 0.0% 0 483ms 286 0
Grok 4.20 4.8 10.0 25.0% 0 501ms 267 0
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 3.6 8.9 0.0% 0 969ms 310 0
Grok 4.20 3.4 9.3 0.0% 0 1.22s 312 0
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 3.0 10.0 0.0% 0 606ms 131 0
Grok 4.20 3.0 10.0 0.0% 0 6.04s 282 0
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 7.3 5.9 83.3% 1 667ms 180 0
Grok 4.20 10.0 10.0 100.0% 0 522ms 207 0
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 5.3 7.2 44.4% 1 534ms 46 0
Grok 4.20 3.0 10.0 0.0% 0 687ms 325 0
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 4.8 10.0 0.0% 0 628ms 159 0
Grok 4.20 4.8 10.0 0.0% 0 659ms 83 0
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 6.5 10.0 50.0% 0 551ms 82 0
Grok 4.20 4.8 10.0 0.0% 0 455ms 60 0
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 3.1 10.0 0.0% 0 533ms 234 0
Grok 4.20 5.3 7.4 44.4% 1 487ms 242 0
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 10.0 10.0 100.0% 0 1.27s 197 0
Grok 4.20 10.0 10.0 100.0% 0 4.63s 189 0

দ্রুত তুলনা

তুলনার জুটি বদলান