নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 2.5 Flash vs xAI: Grok 4.20 Beta

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-03-12

মেট্রিক Gemini 2.5 Flash Gemini 2.5 Flash none প্রকাশ: 2025-06-17 Grok 4.20 Beta Grok 4.20 Beta medium প্রকাশ: 2026-03-12
র‍্যাঙ্ক #42 #24
গড় স্কোর 5.2 7.0
ধারাবাহিকতা 9.1 9.0
প্রতি ফলাফলে খরচ 0.191 5.989
মোট খরচ $0.012 $0.599
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 43.8% 70.8%
অস্থির টেস্ট 2 2
মোট রান 48 48
আউটপুট টোকেন 1,270 1,481
রিজনিং টোকেন 0 86,628
প্রতিক্রিয়া সময় (গড়) 923ms 8.89s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 4.39s 24.21s
প্রতিক্রিয়া সময় (মোট) 14.78s 142.18s

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

গড় স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

গড় স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Gemini 2.5 Flash 10.0 10.0 0.0% 0 668ms 99 0
Grok 4.20 Beta 7.0 7.2 88.9% 1 3.19s 262 6,289
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Gemini 2.5 Flash 10.0 10.0 0.0% 0 4.39s 366 0
Grok 4.20 Beta 10.0 10.0 100.0% 0 20.93s 227 12,212
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Gemini 2.5 Flash 9.9 10.0 100.0% 0 652ms 279 0
Grok 4.20 Beta 9.9 10.0 100.0% 0 4.01s 180 5,281
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Gemini 2.5 Flash 4.0 7.2 55.6% 1 495ms 12 0
Grok 4.20 Beta 4.0 10.0 33.3% 0 21.33s 251 40,255
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Gemini 2.5 Flash 5.0 10.0 0.0% 0 615ms 78 0
Grok 4.20 Beta 10.0 10.0 100.0% 0 5.78s 72 3,440
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Gemini 2.5 Flash 9.0 6.8 66.7% 1 672ms 70 0
Grok 4.20 Beta 9.0 10.0 50.0% 0 4.97s 57 7,107
Puzzle Solving স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Gemini 2.5 Flash 4.7 10.0 33.3% 0 576ms 132 0
Grok 4.20 Beta 7.0 7.2 88.9% 1 3.85s 249 6,660
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Gemini 2.5 Flash 10.0 10.0 100.0% 0 1.91s 234 0
Grok 4.20 Beta 10.0 10.0 0.0% 0 12.39s 183 5,384

দ্রুত তুলনা

তুলনার জুটি বদলান