নেভিগেশন
AI BENCHY
Your ad here

AI BENCHY Compare

OpenAI: GPT-5.3 Chat vs xAI: Grok 4.20

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-04-02

মেট্রিক GPT-5.3 Chat GPT-5.3 Chat none প্রকাশ: 2026-03-03 Grok 4.20 Grok 4.20 medium প্রকাশ: 2026-03-31
স্কোর 7.6 7.1
র‍্যাঙ্ক #32 #40
ধারাবাহিকতা 8.6 8.2
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 66.7% 66.7%
অস্থির টেস্ট 3 4
মোট রান 51 51
প্রতি ফলাফলে খরচ 3.177 7.358
মোট খরচ $0.318 $0.663
???? ??? $1.750 / 1M $2.000 / 1M
????? ??? $14.000 / 1M $6.000 / 1M
আউটপুট টোকেন 19,348 1,494
রিজনিং টোকেন 0 97,078
প্রতিক্রিয়া সময় (গড়) 5.68s 9.50s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 18.33s 29.87s
প্রতিক্রিয়া সময় (মোট) 96.58s 161.54s

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.3 Chat 6.7 8.1 58.3% 1 3.86s 3,167 0
Grok 4.20 8.2 7.9 83.3% 1 3.36s 280 8,476
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.3 Chat 10.0 10.0 100.0% 0 11.96s 2,614 0
Grok 4.20 10.0 10.0 100.0% 0 17.40s 232 9,556
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.3 Chat 10.0 10.0 100.0% 0 2.21s 942 0
Grok 4.20 10.0 10.0 100.0% 0 4.17s 180 5,333
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.3 Chat 3.5 4.4 33.3% 2 13.01s 8,264 0
Grok 4.20 5.3 10.0 33.3% 0 27.03s 375 49,339
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.3 Chat 4.6 10.0 0.0% 0 1.99s 319 0
Grok 4.20 5.8 2.8 66.7% 1 7.09s 47 4,252
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.3 Chat 8.3 10.0 50.0% 0 3.29s 1,455 0
Grok 4.20 7.3 5.9 83.3% 1 4.42s 40 5,474
Puzzle Solving স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.3 Chat 10.0 10.0 100.0% 0 2.93s 1,726 0
Grok 4.20 6.4 7.7 55.6% 1 3.89s 143 8,028
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
GPT-5.3 Chat 10.0 10.0 100.0% 0 8.36s 861 0
Grok 4.20 3.0 10.0 0.0% 0 13.68s 197 6,620

দ্রুত তুলনা

তুলনার জুটি বদলান