#135

GPT-5.4

OpenAI প্রকাশ: 2026-03-05 পরীক্ষিত হয়েছে: 2026-07-16 22:33 openai/gpt-5.4::none

(medium) (none)

সারাংশ

GPT-5.4 AI BENCHY-তে 5.8 স্কোর করে এবং #135 স্থানে আছে। এর reliability 10.0, pass rate 34.9%, মোট খরচ $0.397, এবং গড় response time 2.07s.

GPT-5.4 কে আলাদা করে যা: এটি ধাঁধা সমাধান-তে সবচেয়ে ভালোভাবে নজর কাড়ে, যেখানে এর rank #2; আর অ্যান্টি-এআই কৌশল এর দুর্বলতম ক্ষেত্র, rank #8.

স্কোর

5.8

ধারাবাহিকতা

9.2

নির্ভরযোগ্যতা

10.0

মোট খরচ (বর্তমান মূল্য)

$0.397

মোট আউটপুট টোকেন

8,321

মোট ইনপুট টোকেন

108,632

ইনপুট মূল্য

$2.500 / 1M

আউটপুট মূল্য

$15.000 / 1M

সঠিক টেস্ট

ভুল টেস্ট: 15

প্রতি চেষ্টায় পাস রেট: 34.9%

অস্থির টেস্ট

অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।

প্রতিক্রিয়া সময় (গড়)

2.07s

প্রতিক্রিয়া সময় (সর্বোচ্চ): 15.63s

প্রতিক্রিয়া সময় (মোট): 45.51s

ভুল উত্তর: 14 নির্দেশনা অনুসরণ করা হয়নি: 1

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#135 GPT-5.4

none

খরচ: $0.026
সময়: 18.1s
টোকেন: 1,792 tok

রান ইতিহাস

পরীক্ষিত হয়েছে	স্কোর	নির্ভরযোগ্যতা	মোট খরচ	তুলনা করুন
2026-07-16 22:33 নতুন টেস্ট যোগ হয়েছে	5.8	10.0	$0.397	বর্তমান রান
2026-06-04 13:45 নতুন টেস্ট যোগ হয়েছে	5.5	10.0	$0.122	তুলনা করুন
2026-05-22 00:18 স্যুইট পরিবর্তিত হয়েছে	5.6	10.0	$0.115	তুলনা করুন
2026-04-11 01:44 প্রথম নথিভুক্ত রান	5.9	প্রযোজ্য নয়	$0.104	তুলনা করুন

এই রানটি ভিন্ন একটি বেঞ্চমার্ক স্যুইট ব্যবহার করেছে। ঐতিহাসিক পরিবর্তন পড়ার সময় স্যুইট পরিবর্তনও মাথায় রাখুন।

রান তুলনা

রান	স্কোর	ধারাবাহিকতা	নির্ভরযোগ্যতা	সঠিক টেস্ট	অস্থির টেস্ট	মোট আউটপুট টোকেন	মোট ইনপুট টোকেন	মোট খরচ	প্রতিক্রিয়া সময় (গড়)
2026-07-16 22:33 · বর্তমান রান	5.8	9.2	10.0	7/22	2	8,321	108,632	$0.397	2.07s
2026-04-11 01:44 · প্রথম নথিভুক্ত রান	5.9	9.1	প্রযোজ্য নয়	7/18	2	2,317	0	$0.104	1.51s
পার্থক্য	-0.1	+0.1		0	0	+6004	+108632	+$0.294	+557ms

এই দুই রান ভিন্ন বেঞ্চমার্ক স্যুইট ব্যবহার করেছে, তাই পার্থক্যগুলোতে মডেল পরিবর্তন এবং স্যুইট পরিবর্তন দুটোই ধরা পড়ে।

মূল্যের ইতিহাস

OpenRouter থেকে এই মডেলের ঐতিহাসিক মূল্য তথ্য।

তারিখ	ইনপুট মূল্য	আউটপুট মূল্য
2026-06-04 15:40	$2.500 / 1M	$15.000 / 1M

চার্ট

প্রথম মডেলটি নির্বাচন করুন, তারপর দ্বিতীয় মডেলে ক্লিক করে পাশাপাশি তুলনা পৃষ্ঠা খুলুন।

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

GPT-5.4nonevsGPT-5 Nanomedium GPT-5.4nonevsStep 3.5 Flashmedium GPT-5.4nonevsQwen3.5-35B-A3Bnone GPT-5.4nonevsQwen3.5 Plus 2026-04-20none GPT-5.4nonevsGPT-5.6 Terranone GPT-5.4nonevsGemini 3 Flash Previewmedium GPT-5.4nonevsGemini 3.5 Flashhigh GPT-5.4nonevsNemotron 3 Ultramediumবিনামূল্যে উপলভ্য GPT-5.4nonevsGPT-5.5low

বিভাগভিত্তিক বিশ্লেষণ

বিভাগ	স্কোর	ধারাবাহিকতা
অ্যান্টি-এআই কৌশল	3.2	8.0
কোডিং	5.5	10.0
সমন্বিত	3.0	10.0
ডেটা পার্সিং ও নিষ্কাশন	10.0	10.0
ডোমেইন-নির্দিষ্ট	5.3	7.2
Sadharon Buddhimotta	4.4	9.9
নির্দেশনা অনুসরণ	6.5	10.0
ধাঁধা সমাধান	5.6	9.8
টুল কলিং	10.0	10.0
সাধারণ জ্ঞান	3.0	10.0

GPT-5.4

Hamster playing table tennis

#135 GPT-5.4

চার্ট

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর vs মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

বিভাগভিত্তিক বিশ্লেষণ

তুলনা করা মডেল