নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Grok 4.20 Beta vs xAI: Grok 4.20

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-04-02

মেট্রিক Grok 4.20 Beta Grok 4.20 Beta none প্রকাশ: 2026-03-12 Grok 4.20 Grok 4.20 none প্রকাশ: 2026-03-31
স্কোর 5.3 5.4
র‍্যাঙ্ক #70 #69
ধারাবাহিকতা 9.1 9.5
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 31.4% 31.4%
অস্থির টেস্ট 2 1
মোট রান 51 51
প্রতি ফলাফলে খরচ 2.240 1.809
মোট খরচ $0.090 $0.091
???? ??? $0.000 / 1M $2.000 / 1M
????? ??? $0.000 / 1M $6.000 / 1M
আউটপুট টোকেন 1,517 1,655
রিজনিং টোকেন 0 0
প্রতিক্রিয়া সময় (গড়) 1.19s 1.11s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 6.48s 6.04s
প্রতিক্রিয়া সময় (মোট) 20.22s 18.80s

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Grok 4.20 Beta 4.0 8.4 16.7% 1 597ms 251 0
Grok 4.20 4.8 10.0 25.0% 0 501ms 267 0
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Grok 4.20 Beta 3.0 10.0 0.0% 0 6.48s 282 0
Grok 4.20 3.0 10.0 0.0% 0 6.04s 282 0
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Grok 4.20 Beta 10.0 10.0 100.0% 0 601ms 197 0
Grok 4.20 10.0 10.0 100.0% 0 522ms 207 0
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Grok 4.20 Beta 3.0 10.0 0.0% 0 611ms 160 0
Grok 4.20 3.0 10.0 0.0% 0 687ms 325 0
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Grok 4.20 Beta 5.0 10.0 0.0% 0 541ms 87 0
Grok 4.20 4.8 10.0 0.0% 0 659ms 83 0
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Grok 4.20 Beta 4.8 10.0 0.0% 0 687ms 60 0
Grok 4.20 4.8 10.0 0.0% 0 455ms 60 0
Puzzle Solving স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Grok 4.20 Beta 5.9 7.2 55.6% 1 541ms 291 0
Grok 4.20 5.3 7.4 44.4% 1 487ms 242 0
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Grok 4.20 Beta 10.0 10.0 100.0% 0 4.79s 189 0
Grok 4.20 10.0 10.0 100.0% 0 4.63s 189 0

দ্রুত তুলনা

তুলনার জুটি বদলান