নেভিগেশন
AI BENCHY
Your ad here

AI BENCHY Compare

Google: Gemini 3.1 Pro Preview vs Inception: Mercury 2

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-04-16

মেট্রিক Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium প্রকাশ: 2026-02-19 Mercury 2 Mercury 2 none প্রকাশ: 2026-02-24
স্কোর 9.6 4.8
র‍্যাঙ্ক #2 #89
ধারাবাহিকতা 10.0 9.0
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 94.4% 27.8%
অস্থির টেস্ট 0 2
মোট রান 54 54
প্রতি ফলাফলে খরচ 3.400 0.165
মোট খরচ $0.578 $0.007
???? ??? $2.000 / 1M $0.250 / 1M
????? ??? $12.000 / 1M $0.750 / 1M
আউটপুট টোকেন 1,932 1,625
রিজনিং টোকেন 40,542 0
প্রতিক্রিয়া সময় (গড়) 15.96s 613ms
প্রতিক্রিয়া সময় (সর্বোচ্চ) 40.61s 1.27s
প্রতিক্রিয়া সময় (মোট) 175.52s 11.04s

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.90s 112 3,218
Mercury 2 3.0 10.0 0.0% 0 483ms 286 0
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 19.88s 405 4,201
Mercury 2 3.6 8.9 0.0% 0 969ms 310 0
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Gemini 3.1 Pro Preview 9.5 10.0 100.0% 0 40.61s 432 9,281
Mercury 2 3.0 10.0 0.0% 0 606ms 131 0
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.72s 279 3,904
Mercury 2 7.3 5.9 83.3% 1 667ms 180 0
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Gemini 3.1 Pro Preview 7.7 10.0 66.7% 0 32.73s 18 12,424
Mercury 2 5.3 7.2 44.4% 1 534ms 46 0
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 11.77s 108 1,179
Mercury 2 4.8 10.0 0.0% 0 628ms 159 0
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 9.56s 72 2,236
Mercury 2 6.5 10.0 50.0% 0 551ms 82 0
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.15s 232 3,117
Mercury 2 3.1 10.0 0.0% 0 533ms 234 0
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 23.15s 274 982
Mercury 2 10.0 10.0 100.0% 0 1.27s 197 0

দ্রুত তুলনা

তুলনার জুটি বদলান