নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Inception: Mercury 2 vs xAI: Grok 4.1 Fast

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-05-01

মেট্রিক Mercury 2 Mercury 2 none প্রকাশ: 2026-02-24 Grok 4.1 Fast Grok 4.1 Fast none প্রকাশ: 2025-11-19
স্কোর 4.8 4.5
র‍্যাঙ্ক #125 #130
নির্ভরযোগ্যতা প্রযোজ্য নয় প্রযোজ্য নয়
ধারাবাহিকতা 9.0 8.7
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 27.8% 24.1%
অস্থির টেস্ট 2 3
মোট রান 54 54
প্রতি ফলাফলে খরচ 0.165 0.269
মোট খরচ $0.007 $0.009
???? ??? $0.250 / 1M $0.200 / 1M
????? ??? $0.750 / 1M $0.500 / 1M
আউটপুট টোকেন 1,625 1,721
রিজনিং টোকেন 0 0
প্রতিক্রিয়া সময় (গড়) 613ms 1.76s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 1.27s 5.51s
প্রতিক্রিয়া সময় (মোট) 11.04s 19.35s

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 3.0 10.0 0.0% 0 483ms 286 0
Grok 4.1 Fast 3.2 10.0 0.0% 0 1.07s 235 0
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 3.6 8.9 0.0% 0 969ms 310 0
Grok 4.1 Fast 5.3 3.4 33.3% 1 1.79s 567 0
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 3.0 10.0 0.0% 0 606ms 131 0
Grok 4.1 Fast 3.0 10.0 0.0% 0 3.33s 105 0
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 7.3 5.9 83.3% 1 667ms 180 0
Grok 4.1 Fast 10.0 10.0 100.0% 0 943ms 180 0
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 5.3 7.2 44.4% 1 534ms 46 0
Grok 4.1 Fast 5.9 7.2 55.6% 1 1.06s 15 0
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 4.8 10.0 0.0% 0 628ms 159 0
Grok 4.1 Fast 4.4 9.9 0.0% 0 1.08s 112 0
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 6.5 10.0 50.0% 0 551ms 82 0
Grok 4.1 Fast 3.0 10.0 0.0% 0 923ms 56 0
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 3.1 10.0 0.0% 0 533ms 234 0
Grok 4.1 Fast 3.2 10.0 0.0% 0 1.28s 243 0
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 10.0 10.0 100.0% 0 1.27s 197 0
Grok 4.1 Fast 2.8 1.6 33.3% 1 5.51s 208 0

দ্রুত তুলনা

তুলনার জুটি বদলান