#43

GPT-5.4 Nano

OpenAI প্রকাশ: 2026-03-17 পরীক্ষিত হয়েছে: 2026-04-11 01:44 openai/gpt-5.4-nano::medium

(medium) (none)

সারাংশ

GPT-5.4 Nano AI BENCHY-তে 7.6 স্কোর করে এবং #43 স্থানে আছে। এর reliability প্রযোজ্য নয়, pass rate 68.5%, মোট খরচ $0.083, এবং গড় response time 11.21s.

GPT-5.4 Nano কে আলাদা করে যা: এটি কোডিং-তে সবচেয়ে ভালোভাবে নজর কাড়ে, যেখানে এর rank #1; আর ধাঁধা সমাধান এর দুর্বলতম ক্ষেত্র, rank #18. এই score range-এর জন্য মোট benchmark খরচ অস্বাভাবিকভাবে কম।

স্কোর

7.6

ধারাবাহিকতা

9.0

নির্ভরযোগ্যতা

প্রযোজ্য নয়

মোট খরচ (বর্তমান মূল্য)

$0.083

মোট আউটপুট টোকেন

61,078

মোট ইনপুট টোকেন

ইনপুট মূল্য

$0.200 / 1M

আউটপুট মূল্য

$1.250 / 1M

সঠিক টেস্ট

ভুল টেস্ট: 7

প্রতি চেষ্টায় পাস রেট: 68.5%

অস্থির টেস্ট

অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।

প্রতিক্রিয়া সময় (গড়)

11.21s

প্রতিক্রিয়া সময় (সর্বোচ্চ): 94.06s

প্রতিক্রিয়া সময় (মোট): 201.80s

ভুল উত্তর: 4 নির্দেশনা অনুসরণ করা হয়নি: 3

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#43 GPT-5.4 Nano

medium

খরচ: $0.007
সময়: 24.6s
টোকেন: 4,943 tok

রান ইতিহাস

পরীক্ষিত হয়েছে	স্কোর	নির্ভরযোগ্যতা	মোট খরচ	তুলনা করুন
2026-07-16 22:36 নতুন টেস্ট যোগ হয়েছে	7.5	10.0	$0.138	তুলনা করুন
2026-06-04 13:46 নতুন টেস্ট যোগ হয়েছে	7.0	10.0	$0.107	তুলনা করুন
2026-05-22 00:20 স্যুইট পরিবর্তিত হয়েছে	7.1	10.0	$0.099	তুলনা করুন
2026-04-11 01:44 প্রথম নথিভুক্ত রান	7.6	প্রযোজ্য নয়	$0.083	বর্তমান রান

চার্ট

প্রথম মডেলটি নির্বাচন করুন, তারপর দ্বিতীয় মডেলে ক্লিক করে পাশাপাশি তুলনা পৃষ্ঠা খুলুন।

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

GPT-5.4 NanomediumvsKimi K2.7 Codemedium GPT-5.4 NanomediumvsGPT-5.3 Chatnone GPT-5.4 NanomediumvsClaude Opus 5none GPT-5.4 NanomediumvsGPT-5.6 Terralow GPT-5.4 NanomediumvsNemotron 3 Ultramediumবিনামূল্যে উপলভ্য GPT-5.4 NanomediumvsGPT-5.4 Minimedium GPT-5.4 NanomediumvsGPT-5.6 Lunamedium GPT-5.4 NanomediumvsQwen3.5 Plus 2026-02-15medium GPT-5.4 NanomediumvsGrok Build 0.1medium GPT-5.4 NanomediumvsQwen3.5-27Bmedium

বিভাগভিত্তিক বিশ্লেষণ

বিভাগ	স্কোর	ধারাবাহিকতা
অ্যান্টি-এআই কৌশল	8.3	10.0
কোডিং	10.0	10.0
সমন্বিত	9.8	10.0
ডেটা পার্সিং ও নিষ্কাশন	10.0	10.0
ডোমেইন-নির্দিষ্ট	5.9	7.2
Sadharon Buddhimotta	4.5	10.0
নির্দেশনা অনুসরণ	9.8	10.0
ধাঁধা সমাধান	4.0	7.1
টুল কলিং	10.0	10.0

GPT-5.4 Nano

Hamster playing table tennis

#43 GPT-5.4 Nano

চার্ট

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর vs মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

বিভাগভিত্তিক বিশ্লেষণ

তুলনা করা মডেল