AI BENCHY Compare

OpenAI: GPT-5.5 vs xAI: Grok 4.3

সারাংশ

GPT-5.5 vs Grok 4.3 benchmark তুলনা: GPT-5.5 average score-এ এগিয়ে: 9.3 vs 7.7. Grok 4.3-এর benchmark খরচ কম: $0.614 vs $0.907. GPT-5.5 দ্রুত: 9.76s vs 47.51s, pass rates 85.7% vs 71.4%.

প্রস্তাবিত মডেল: GPT-5.5 - It has the best score here (9.3), while responding about 4.9x faster than Grok 4.3.

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-06-12

মেট্রিক	GPT-5.5 GPT-5.5 low প্রকাশ: 2026-04-24	Grok 4.3 Grok 4.3 medium প্রকাশ: 2026-05-01

মেট্রিক	GPT-5.5 GPT-5.5 low প্রকাশ: 2026-04-24	Grok 4.3 Grok 4.3 medium প্রকাশ: 2026-05-01
স্কোর	9.3	7.7
র‍্যাঙ্ক	#5	#40
নির্ভরযোগ্যতা	10.0	10.0
ধারাবাহিকতা	10.0	8.5
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট	85.7%	71.4%
অস্থির টেস্ট	0	4
মোট রান	63	63
প্রতি ফলাফলে খরচ	5.035	4.724
মোট খরচ	$0.907	$0.614
ইনপুট মূল্য	$5.000 / 1M	$1.250 / 1M
আউটপুট মূল্য	$30.000 / 1M	$2.500 / 1M
মোট ইনপুট টোকেন	34,209	44,472
আউটপুট টোকেন	2,046	1,981
রিজনিং টোকেন	22,460	221,382
প্রতিক্রিয়া সময় (গড়)	9.76s	47.51s
প্রতিক্রিয়া সময় (সর্বোচ্চ)	56.19s	216.69s
প্রতিক্রিয়া সময় (মোট)	204.92s	997.68s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#5 GPT-5.5

low

Cost: $0.068
Time: 37.0s
Tokens: 2,339 tok

#40 xAI: Grok 4.3

medium

Cost: $0.009
Time: 19.0s
Tokens: 3,661 tok

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল	স্কোর	ধারাবাহিকতা	প্রতি চেষ্টায় পাস রেট	অস্থির টেস্ট	সঠিক টেস্ট	প্রতিক্রিয়া সময় (গড়)	ইনপুট টোকেন	আউটপুট টোকেন	রিজনিং টোকেন
GPT-5.5	10.0	10.0	100.0%	0		4.41s	606	238	1,020
Grok 4.3	10.0	10.0	100.0%	0		8.83s	2,010	88	8,207

কোডিং	স্কোর	ধারাবাহিকতা	প্রতি চেষ্টায় পাস রেট	অস্থির টেস্ট	সঠিক টেস্ট	প্রতিক্রিয়া সময় (গড়)	ইনপুট টোকেন	আউটপুট টোকেন	রিজনিং টোকেন
GPT-5.5	10.0	10.0	100.0%	0		15.04s	7,302	423	6,402
Grok 4.3	5.9	7.7	44.4%	1		41.23s	8,340	1,028	31,226

সমন্বিত	স্কোর	ধারাবাহিকতা	প্রতি চেষ্টায় পাস রেট	অস্থির টেস্ট	সঠিক টেস্ট	প্রতিক্রিয়া সময় (গড়)	ইনপুট টোকেন	আউটপুট টোকেন	রিজনিং টোকেন
GPT-5.5	10.0	10.0	100.0%	0		9.56s	11,019	303	717
Grok 4.3	10.0	10.0	100.0%	0		63.99s	12,909	234	15,301

ডেটা পার্সিং ও নিষ্কাশন	স্কোর	ধারাবাহিকতা	প্রতি চেষ্টায় পাস রেট	অস্থির টেস্ট	সঠিক টেস্ট	প্রতিক্রিয়া সময় (গড়)	ইনপুট টোকেন	আউটপুট টোকেন	রিজনিং টোকেন
GPT-5.5	10.0	10.0	100.0%	0		3.28s	7,140	228	157
Grok 4.3	10.0	10.0	100.0%	0		18.97s	7,761	180	9,546

ডোমেইন-নির্দিষ্ট	স্কোর	ধারাবাহিকতা	প্রতি চেষ্টায় পাস রেট	অস্থির টেস্ট	সঠিক টেস্ট	প্রতিক্রিয়া সময় (গড়)	ইনপুট টোকেন	আউটপুট টোকেন	রিজনিং টোকেন
GPT-5.5	5.3	10.0	33.3%	0		28.05s	723	69	11,609
Grok 4.3	5.3	7.2	44.4%	1		181.74s	1,764	14	111,300

Sadharon Buddhimotta	স্কোর	ধারাবাহিকতা	প্রতি চেষ্টায় পাস রেট	অস্থির টেস্ট	সঠিক টেস্ট	প্রতিক্রিয়া সময় (গড়)	ইনপুট টোকেন	আউটপুট টোকেন	রিজনিং টোকেন
GPT-5.5	10.0	10.0	100.0%	0		5.17s	477	133	245
Grok 4.3	5.4	2.5	66.7%	1		24.70s	825	70	5,020

নির্দেশনা অনুসরণ	স্কোর	ধারাবাহিকতা	প্রতি চেষ্টায় পাস রেট	অস্থির টেস্ট	সঠিক টেস্ট	প্রতিক্রিয়া সময় (গড়)	ইনপুট টোকেন	আউটপুট টোকেন	রিজনিং টোকেন
GPT-5.5	9.9	10.0	100.0%	0		3.74s	660	93	415
Grok 4.3	9.8	10.0	100.0%	0		18.58s	1,362	57	8,713

ধাঁধা সমাধান	স্কোর	ধারাবাহিকতা	প্রতি চেষ্টায় পাস রেট	অস্থির টেস্ট	সঠিক টেস্ট	প্রতিক্রিয়া সময় (গড়)	ইনপুট টোকেন	আউটপুট টোকেন	রিজনিং টোকেন
GPT-5.5	10.0	10.0	100.0%	0		4.74s	642	279	954
Grok 4.3	5.9	7.2	55.6%	1		22.52s	1,689	128	14,468

টুল কলিং	স্কোর	ধারাবাহিকতা	প্রতি চেষ্টায় পাস রেট	অস্থির টেস্ট	সঠিক টেস্ট	প্রতিক্রিয়া সময় (গড়)	ইনপুট টোকেন	আউটপুট টোকেন	রিজনিং টোকেন
GPT-5.5	10.0	10.0	100.0%	0		4.96s	5,445	250	101
Grok 4.3	10.0	10.0	100.0%	0		17.66s	7,263	168	4,615

সাধারণ জ্ঞান	স্কোর	ধারাবাহিকতা	প্রতি চেষ্টায় পাস রেট	অস্থির টেস্ট	সঠিক টেস্ট	প্রতিক্রিয়া সময় (গড়)	ইনপুট টোকেন	আউটপুট টোকেন	রিজনিং টোকেন
GPT-5.5	3.0	10.0	0.0%	0		10.06s	195	30	840
Grok 4.3	3.0	10.0	0.0%	0		44.47s	549	14	12,986

দ্রুত তুলনা

তুলনার জুটি বদলান

Step 3.7 FlashlowvsGrok 4.3medium GPT-5.5lowvsQwen3.7 Maxmedium Claude Fable 5mediumvsGPT-5.5low Gemini 3.1 Pro PreviewmediumvsGPT-5.5low Gemini 3.5 FlashmediumvsGPT-5.5low GPT-5.3 ChatnonevsGrok 4.3medium Gemini 3 Flash PreviewmediumvsGPT-5.5low Gemini 3 Flash PreviewlowvsGrok 4.3medium Claude Sonnet 4.6nonevsGrok 4.3medium GPT-5.5lowvsQwen3.6 Max Previewmedium Claude Opus 4.8nonevsGrok 4.3medium Claude Opus 4.8mediumvsGPT-5.5low