নেভিগেশন
AI BENCHY
Your ad here

AI BENCHY Compare

Google: Gemini 3.1 Pro Preview vs Grok 4.20 Multi Agent Beta

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-04-26

মেট্রিক Gemini 3.1 Pro Preview Gemini 3.1 Pro Preview medium প্রকাশ: 2026-02-19 Grok 4.20 Multi Agent Beta Grok 4.20 Multi Agent Beta medium প্রকাশ: 2026-03-12
স্কোর 9.6 6.4
র‍্যাঙ্ক #2 #67
নির্ভরযোগ্যতা প্রযোজ্য নয় প্রযোজ্য নয়
ধারাবাহিকতা 10.0 7.4
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 94.4% 57.4%
অস্থির টেস্ট 0 6
মোট রান 54 52
প্রতি ফলাফলে খরচ 3.400 72.473
মোট খরচ $0.578 $5.074
???? ??? $2.000 / 1M $0.000 / 1M
????? ??? $12.000 / 1M $0.000 / 1M
আউটপুট টোকেন 1,932 299,034
রিজনিং টোকেন 40,542 309,670
প্রতিক্রিয়া সময় (গড়) 15.96s 9.80s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 40.61s 35.28s
প্রতিক্রিয়া সময় (মোট) 175.52s 156.75s

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.90s 112 3,218
Grok 4.20 Multi Agent Beta 6.9 5.8 75.0% 2 3.46s 33,706 33,077
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 19.88s 405 4,201
Grok 4.20 Multi Agent Beta 10.0 10.0 100.0% 0 27.11s 86 13,141
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Gemini 3.1 Pro Preview 9.5 10.0 100.0% 0 40.61s 432 9,281
Grok 4.20 Multi Agent Beta 3.0 10.0 0.0% 0 0ms 0 0
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.72s 279 3,904
Grok 4.20 Multi Agent Beta 10.0 10.0 100.0% 0 5.54s 25,306 25,051
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Gemini 3.1 Pro Preview 7.7 10.0 66.7% 0 32.73s 18 12,424
Grok 4.20 Multi Agent Beta 2.9 7.2 11.1% 1 24.67s 164,609 163,647
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 11.77s 108 1,179
Grok 4.20 Multi Agent Beta 5.8 2.8 66.7% 1 6.40s 15,848 15,746
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 9.56s 72 2,236
Grok 4.20 Multi Agent Beta 8.3 10.0 50.0% 0 4.63s 25,457 25,322
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.15s 232 3,117
Grok 4.20 Multi Agent Beta 7.2 5.1 77.8% 2 5.01s 34,022 33,686
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 23.15s 274 982
Grok 4.20 Multi Agent Beta 3.0 10.0 0.0% 0 0ms 0 0

দ্রুত তুলনা

তুলনার জুটি বদলান