নেভিগেশন
AI BENCHY
Advertise here

AI BENCHY Compare

OpenAI: GPT-5.3 Chat vs xAI: Grok 4.3

সারাংশ

GPT-5.3 Chat vs Grok 4.3 benchmark তুলনা: Grok 4.3 average score-এ এগিয়ে: 7.7 vs 7.5. GPT-5.3 Chat-এর benchmark খরচ কম: $0.433 vs $0.614. GPT-5.3 Chat দ্রুত: 6.34s vs 47.51s, pass rates 66.7% vs 71.4%.

প্রস্তাবিত মডেল: GPT-5.3 Chat - Its score stays close to the best score here (7.5 vs 7.7), while responding about 7.5x faster than Grok 4.3.

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-06-12

মেট্রিক GPT-5.3 Chat GPT-5.3 Chat none প্রকাশ: 2026-03-03 Grok 4.3 Grok 4.3 medium প্রকাশ: 2026-05-01
স্কোর 7.5 7.7
র‍্যাঙ্ক #47 #40
নির্ভরযোগ্যতা 10.0 10.0
ধারাবাহিকতা 8.1 8.5
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 66.7% 71.4%
অস্থির টেস্ট 5 4
মোট রান 63 63
প্রতি ফলাফলে খরচ 3.605 4.724
মোট খরচ $0.433 $0.614
ইনপুট মূল্য $1.750 / 1M $1.250 / 1M
আউটপুট মূল্য $14.000 / 1M $2.500 / 1M
মোট ইনপুট টোকেন 34,209 44,472
আউটপুট টোকেন 26,617 1,981
রিজনিং টোকেন 0 221,382
প্রতিক্রিয়া সময় (গড়) 6.34s 47.51s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 18.33s 216.69s
প্রতিক্রিয়া সময় (মোট) 133.13s 997.68s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#47 GPT-5.3 Chat

none
Cost
$0.008
Time
8.1s
Tokens
634 tok

#40 xAI: Grok 4.3

medium
Cost
$0.009
Time
19.0s
Tokens
3,661 tok

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.3 Chat 6.7 8.1 58.3% 1 3.86s 606 3,167 0
Grok 4.3 10.0 10.0 100.0% 0 8.83s 2,010 88 8,207
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.3 Chat 5.6 4.7 55.6% 2 10.52s 7,302 6,632 0
Grok 4.3 5.9 7.7 44.4% 1 41.23s 8,340 1,028 31,226
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.3 Chat 10.0 10.0 100.0% 0 11.96s 11,019 2,614 0
Grok 4.3 10.0 10.0 100.0% 0 63.99s 12,909 234 15,301
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.3 Chat 10.0 10.0 100.0% 0 2.21s 7,140 942 0
Grok 4.3 10.0 10.0 100.0% 0 18.97s 7,761 180 9,546
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.3 Chat 3.5 4.4 33.3% 2 13.01s 723 8,264 0
Grok 4.3 5.3 7.2 44.4% 1 181.74s 1,764 14 111,300
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.3 Chat 4.6 10.0 0.0% 0 1.99s 477 319 0
Grok 4.3 5.4 2.5 66.7% 1 24.70s 825 70 5,020
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.3 Chat 9.8 10.0 100.0% 0 3.51s 660 1,491 0
Grok 4.3 9.8 10.0 100.0% 0 18.58s 1,362 57 8,713
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.3 Chat 10.0 10.0 100.0% 0 2.99s 642 1,758 0
Grok 4.3 5.9 7.2 55.6% 1 22.52s 1,689 128 14,468
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.3 Chat 10.0 10.0 100.0% 0 8.36s 5,445 861 0
Grok 4.3 10.0 10.0 100.0% 0 17.66s 7,263 168 4,615
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
GPT-5.3 Chat 3.0 10.0 0.0% 0 4.38s 195 569 0
Grok 4.3 3.0 10.0 0.0% 0 44.47s 549 14 12,986

দ্রুত তুলনা

তুলনার জুটি বদলান