#64

GPT-5.4 Nano

OpenAI প্রকাশ: 2026-03-17 পরীক্ষিত হয়েছে: 2026-05-22 00:20 openai/gpt-5.4-nano::medium

(medium) (none)

সারাংশ

GPT-5.4 Nano AI BENCHY-তে 7.1 স্কোর করে এবং #64 স্থানে আছে। এর reliability 10.0, pass rate 63.3%, মোট খরচ $0.099, এবং গড় response time 11.77s.

GPT-5.4 Nano কে আলাদা করে যা: এটি ডোমেইন-নির্দিষ্ট-তে সবচেয়ে ভালোভাবে নজর কাড়ে, যেখানে এর rank #3; আর ধাঁধা সমাধান এর দুর্বলতম ক্ষেত্র, rank #17. এই score range-এর জন্য মোট benchmark খরচ অস্বাভাবিকভাবে কম।

স্কোর

7.1

ধারাবাহিকতা

8.8

নির্ভরযোগ্যতা

10.0

মোট খরচ (বর্তমান মূল্য)

$0.099

মোট আউটপুট টোকেন

73,915

মোট ইনপুট টোকেন

ইনপুট মূল্য

$0.200 / 1M

আউটপুট মূল্য

$1.250 / 1M

সঠিক টেস্ট

ভুল টেস্ট: 9

প্রতি চেষ্টায় পাস রেট: 63.3%

অস্থির টেস্ট

অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।

প্রতিক্রিয়া সময় (গড়)

11.77s

প্রতিক্রিয়া সময় (সর্বোচ্চ): 94.06s

প্রতিক্রিয়া সময় (মোট): 235.41s

ভুল উত্তর: 7 নির্দেশনা অনুসরণ করা হয়নি: 2

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#64 GPT-5.4 Nano

medium

খরচ: $0.007
সময়: 24.6s
টোকেন: 4,943 tok

রান ইতিহাস

পরীক্ষিত হয়েছে	স্কোর	নির্ভরযোগ্যতা	মোট খরচ	তুলনা করুন
2026-07-16 22:36 নতুন টেস্ট যোগ হয়েছে	7.5	10.0	$0.138	তুলনা করুন
2026-06-04 13:46 নতুন টেস্ট যোগ হয়েছে	7.0	10.0	$0.107	তুলনা করুন
2026-05-22 00:20 স্যুইট পরিবর্তিত হয়েছে	7.1	10.0	$0.099	বর্তমান রান
2026-04-11 01:44 প্রথম নথিভুক্ত রান	7.6	প্রযোজ্য নয়	$0.083	তুলনা করুন

এই রানটি ভিন্ন একটি বেঞ্চমার্ক স্যুইট ব্যবহার করেছে। ঐতিহাসিক পরিবর্তন পড়ার সময় স্যুইট পরিবর্তনও মাথায় রাখুন।

চার্ট

প্রথম মডেলটি নির্বাচন করুন, তারপর দ্বিতীয় মডেলে ক্লিক করে পাশাপাশি তুলনা পৃষ্ঠা খুলুন।

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

GPT-5.4 NanomediumvsKimi K2.7 Codemedium GPT-5.4 NanomediumvsGPT-5.3 Chatnone GPT-5.4 NanomediumvsClaude Opus 5none GPT-5.4 NanomediumvsGPT-5.6 Terralow GPT-5.4 NanomediumvsNemotron 3 Ultramediumবিনামূল্যে উপলভ্য GPT-5.4 NanomediumvsGPT-5.4 Minimedium GPT-5.4 NanomediumvsGPT-5.6 Lunamedium GPT-5.4 NanomediumvsQwen3.5 Plus 2026-02-15medium GPT-5.4 NanomediumvsGrok Build 0.1medium GPT-5.4 NanomediumvsQwen3.5-27Bmedium

বিভাগভিত্তিক বিশ্লেষণ

বিভাগ	স্কোর	ধারাবাহিকতা
অ্যান্টি-এআই কৌশল	8.3	10.0
কোডিং	6.8	6.2
সমন্বিত	9.8	10.0
ডেটা পার্সিং ও নিষ্কাশন	10.0	10.0
ডোমেইন-নির্দিষ্ট	5.9	7.2
Sadharon Buddhimotta	4.5	10.0
নির্দেশনা অনুসরণ	9.8	10.0
ধাঁধা সমাধান	3.7	7.1
টুল কলিং	10.0	10.0
সাধারণ জ্ঞান	3.0	10.0

GPT-5.4 Nano

Hamster playing table tennis

#64 GPT-5.4 Nano

চার্ট

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর vs মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

বিভাগভিত্তিক বিশ্লেষণ

তুলনা করা মডেল