Anthropic: Claude Opus 4.7 vs OpenAI: GPT-5.4

Claude Opus 4.7 (medium) average score-এ এগিয়ে: 8.7 vs 8.5. Claude Opus 4.7 (medium)-এর benchmark খরচ কম: $1.477 vs $1.533. Claude Opus 4.7 (medium) দ্রুত: 7.61s vs 23.10s, pass rates 83.3% vs 77.3%.

প্রস্তাবিত মডেলClaude Opus 4.7 (medium)It has the best score here (8.7), while responding about 3.0x faster than GPT-5.4 (medium).

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-07-18

মেট্রিক	Claude Opus 4.7 Claude Opus 4.7 medium প্রকাশ: 2026-04-16	GPT-5.4 GPT-5.4 medium প্রকাশ: 2026-03-05

মেট্রিক	Claude Opus 4.7 Claude Opus 4.7 medium প্রকাশ: 2026-04-16	GPT-5.4 GPT-5.4 medium প্রকাশ: 2026-03-05
স্কোর	8.7	8.5
র‍্যাঙ্ক	#15	#18
নির্ভরযোগ্যতা	10.0	10.0
ধারাবাহিকতা	9.6	8.6
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট	83.3%	77.3%
অস্থির টেস্ট	1	4
মোট রান	66	66
প্রতি ফলাফলে খরচ	8.201	10.220
মোট খরচ	$1.477	$1.533
ইনপুট মূল্য	$5.000 / 1M	$2.500 / 1M
আউটপুট মূল্য	$25.000 / 1M	$15.000 / 1M
মোট ইনপুট টোকেন	145,252	81,127
আউটপুট টোকেন	24,948	6,155
রিজনিং টোকেন	5,042	82,515
প্রতিক্রিয়া সময় (গড়)	7.61s	23.10s
প্রতিক্রিয়া সময় (সর্বোচ্চ)	65.40s	100.41s
প্রতিক্রিয়া সময় (মোট)	159.91s	508.26s

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#15 Claude Opus 4.7

medium

খরচ: $0.059
সময়: 26.8s
টোকেন: 2,475 tok

#18 GPT-5.4

medium

খরচ: $0.214
সময়: 199.6s
টোকেন: 14,349 tok

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

বিভাগ:

অ্যান্টি-এআই কৌশল	স্কোর	ধারাবাহিকতা	প্রতি চেষ্টায় পাস রেট	অস্থির টেস্ট	সঠিক টেস্ট	প্রতিক্রিয়া সময় (গড়)	ইনপুট টোকেন	আউটপুট টোকেন	রিজনিং টোকেন
Claude Opus 4.7	8.3	10.0	75.0%	0		1.85s	894	348	0
GPT-5.4	8.3	10.0	75.0%	0		4.11s	606	240	1,511

কোডিং	স্কোর	ধারাবাহিকতা	প্রতি চেষ্টায় পাস রেট	অস্থির টেস্ট	সঠিক টেস্ট	প্রতিক্রিয়া সময় (গড়)	ইনপুট টোকেন	আউটপুট টোকেন	রিজনিং টোকেন
Claude Opus 4.7	7.6	7.2	77.8%	1		12.96s	10,635	7,629	1,114
GPT-5.4	8.8	7.8	88.9%	1		44.36s	7,305	433	24,216

সমন্বিত	স্কোর	ধারাবাহিকতা	প্রতি চেষ্টায় পাস রেট	অস্থির টেস্ট	সঠিক টেস্ট	প্রতিক্রিয়া সময় (গড়)	ইনপুট টোকেন	আউটপুট টোকেন	রিজনিং টোকেন
Claude Opus 4.7	10.0	10.0	100.0%	0		43.42s	104,347	15,459	3,928
GPT-5.4	10.0	10.0	100.0%	0		29.77s	58,038	4,214	13,351

ডেটা পার্সিং ও নিষ্কাশন	স্কোর	ধারাবাহিকতা	প্রতি চেষ্টায় পাস রেট	অস্থির টেস্ট	সঠিক টেস্ট	প্রতিক্রিয়া সময় (গড়)	ইনপুট টোকেন	আউটপুট টোকেন	রিজনিং টোকেন
Claude Opus 4.7	10.0	10.0	100.0%	0		2.37s	10,533	324	0
GPT-5.4	10.0	10.0	100.0%	0		5.32s	7,140	234	804

ডোমেইন-নির্দিষ্ট	স্কোর	ধারাবাহিকতা	প্রতি চেষ্টায় পাস রেট	অস্থির টেস্ট	সঠিক টেস্ট	প্রতিক্রিয়া সময় (গড়)	ইনপুট টোকেন	আউটপুট টোকেন	রিজনিং টোকেন
Claude Opus 4.7	7.7	10.0	66.7%	0		1.17s	630	51	0
GPT-5.4	5.3	7.2	44.4%	1		74.27s	619	61	34,748

Sadharon Buddhimotta	স্কোর	ধারাবাহিকতা	প্রতি চেষ্টায় পাস রেট	অস্থির টেস্ট	সঠিক টেস্ট	প্রতিক্রিয়া সময় (গড়)	ইনপুট টোকেন	আউটপুট টোকেন	রিজনিং টোকেন
Claude Opus 4.7	10.0	10.0	100.0%	0		2.87s	723	256	0
GPT-5.4	4.7	3.1	33.3%	1		4.92s	477	145	321

নির্দেশনা অনুসরণ	স্কোর	ধারাবাহিকতা	প্রতি চেষ্টায় পাস রেট	অস্থির টেস্ট	সঠিক টেস্ট	প্রতিক্রিয়া সময় (গড়)	ইনপুট টোকেন	আউটপুট টোকেন	রিজনিং টোকেন
Claude Opus 4.7	10.0	10.0	100.0%	0		1.57s	939	114	0
GPT-5.4	10.0	10.0	100.0%	0		3.11s	660	93	897

ধাঁধা সমাধান	স্কোর	ধারাবাহিকতা	প্রতি চেষ্টায় পাস রেট	অস্থির টেস্ট	সঠিক টেস্ট	প্রতিক্রিয়া সময় (গড়)	ইনপুট টোকেন	আউটপুট টোকেন	রিজনিং টোকেন
Claude Opus 4.7	10.0	10.0	100.0%	0		2.43s	939	370	0
GPT-5.4	8.2	7.2	88.9%	1		9.14s	642	441	3,815

টুল কলিং	স্কোর	ধারাবাহিকতা	প্রতি চেষ্টায় পাস রেট	অস্থির টেস্ট	সঠিক টেস্ট	প্রতিক্রিয়া সময় (গড়)	ইনপুট টোকেন	আউটপুট টোকেন	রিজনিং টোকেন
Claude Opus 4.7	10.0	10.0	100.0%	0		4.17s	15,339	373	0
GPT-5.4	10.0	10.0	100.0%	0		13.28s	5,445	264	1,031

সাধারণ জ্ঞান	স্কোর	ধারাবাহিকতা	প্রতি চেষ্টায় পাস রেট	অস্থির টেস্ট	সঠিক টেস্ট	প্রতিক্রিয়া সময় (গড়)	ইনপুট টোকেন	আউটপুট টোকেন	রিজনিং টোকেন
Claude Opus 4.7	3.0	10.0	0.0%	0		2.25s	273	24	0
GPT-5.4	3.0	10.0	0.0%	0		13.95s	195	30	1,821

দ্রুত তুলনা

তুলনার জুটি বদলান

GPT-5.4mediumvsGrok 4.5low Claude Opus 4.7mediumvsGrok 4.5high Claude Opus 4.7mediumvsGemini 3.5 Flashlow Muse Spark 1.1lowvsGPT-5.4medium Claude Opus 4.7mediumvsGrok 4.5low GPT-5.4mediumvsGrok 4.5high Gemini 3.5 FlashlowvsGPT-5.4medium Claude Opus 4.7mediumvsMuse Spark 1.1low Muse Spark 1.1highvsGPT-5.4medium GPT-5.4mediumvsInklinghigh GPT-5.4mediumvsGLM 5.2high Kimi K3maxvsGPT-5.4medium