নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

HY3 Preview vs Grok 4.20 Beta

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-04-26

মেট্রিক HY3 Preview HY3 Preview high প্রকাশ: 2026-04-22 বিনামূল্যে উপলভ্য Grok 4.20 Beta Grok 4.20 Beta medium প্রকাশ: 2026-03-12
স্কোর 8.5 8.0
র‍্যাঙ্ক #11 #31
নির্ভরযোগ্যতা প্রযোজ্য নয় প্রযোজ্য নয়
ধারাবাহিকতা 8.8 9.1
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 81.5% 74.1%
অস্থির টেস্ট 3 2
মোট রান 50 52
প্রতি ফলাফলে খরচ 0.000 5.269
মোট খরচ $0.000 $0.633
???? ??? $0.000 / 1M $0.000 / 1M
????? ??? $0.000 / 1M $0.000 / 1M
আউটপুট টোকেন 238,920 1,568
রিজনিং টোকেন 0 91,909
প্রতিক্রিয়া সময় (গড়) 55.19s 9.81s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 149.94s 31.36s
প্রতিক্রিয়া সময় (মোট) 938.23s 176.62s

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
HY3 Preview 10.0 10.0 100.0% 0 32.69s 26,550 0
Grok 4.20 Beta 8.7 7.9 91.7% 1 3.16s 268 7,583
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
HY3 Preview 10.0 10.0 100.0% 0 99.76s 38,167 0
Grok 4.20 Beta 10.0 10.0 100.0% 0 31.36s 81 3,987
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
HY3 Preview 10.0 10.0 100.0% 0 113.09s 31,319 0
Grok 4.20 Beta 10.0 10.0 100.0% 0 20.93s 227 12,212
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
HY3 Preview 6.5 10.0 50.0% 0 12.11s 4,323 0
Grok 4.20 Beta 10.0 10.0 100.0% 0 4.01s 180 5,281
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
HY3 Preview 5.3 7.2 44.4% 1 109.04s 87,559 0
Grok 4.20 Beta 5.3 10.0 33.3% 0 21.33s 251 40,255
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
HY3 Preview 10.0 10.0 100.0% 0 24.31s 5,490 0
Grok 4.20 Beta 10.0 10.0 100.0% 0 5.78s 72 3,440
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
HY3 Preview 8.5 6.8 83.3% 1 34.02s 13,331 0
Grok 4.20 Beta 8.3 10.0 50.0% 0 4.97s 57 7,107
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
HY3 Preview 9.0 7.9 88.9% 1 28.07s 21,811 0
Grok 4.20 Beta 8.2 7.2 88.9% 1 3.85s 249 6,660
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
HY3 Preview 10.0 10.0 100.0% 0 78.83s 10,370 0
Grok 4.20 Beta 3.0 10.0 0.0% 0 12.39s 183 5,384

দ্রুত তুলনা

তুলনার জুটি বদলান