#93

GPT-5.4 Mini

OpenAI প্রকাশ: 2026-03-17 পরীক্ষিত হয়েছে: 2026-04-11 01:44 openai/gpt-5.4-mini::none

(medium) (none)

সারাংশ

GPT-5.4 Mini AI BENCHY-তে 5.1 স্কোর করে এবং #93 স্থানে আছে। এর reliability প্রযোজ্য নয়, pass rate 35.2%, মোট খরচ $0.032, এবং গড় response time 1.17s.

GPT-5.4 Mini কে আলাদা করে যা: এটি কোডিং-তে সবচেয়ে ভালোভাবে নজর কাড়ে, যেখানে এর rank #1; আর অ্যান্টি-এআই কৌশল এর দুর্বলতম ক্ষেত্র, rank #18. এই score range-এর জন্য মোট benchmark খরচ অস্বাভাবিকভাবে কম। একই ধরনের মডেলের তুলনায় এটি লক্ষণীয়ভাবে দ্রুত।

স্কোর

5.1

ধারাবাহিকতা

8.6

নির্ভরযোগ্যতা

প্রযোজ্য নয়

মোট খরচ (বর্তমান মূল্য)

$0.032

মোট আউটপুট টোকেন

2,418

মোট ইনপুট টোকেন

ইনপুট মূল্য

$0.750 / 1M

আউটপুট মূল্য

$4.500 / 1M

সঠিক টেস্ট

ভুল টেস্ট: 13

প্রতি চেষ্টায় পাস রেট: 35.2%

অস্থির টেস্ট

অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।

প্রতিক্রিয়া সময় (গড়)

1.17s

প্রতিক্রিয়া সময় (সর্বোচ্চ): 2.52s

প্রতিক্রিয়া সময় (মোট): 21.01s

ভুল উত্তর: 10 নির্দেশনা অনুসরণ করা হয়নি: 3

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#93 GPT-5.4 Mini

none

খরচ: $0.010
সময়: 11.7s
টোকেন: 2,151 tok

রান ইতিহাস

পরীক্ষিত হয়েছে	স্কোর	নির্ভরযোগ্যতা	মোট খরচ	তুলনা করুন
2026-07-16 22:33 নতুন টেস্ট যোগ হয়েছে	5.9	10.0	$0.095	তুলনা করুন
2026-06-04 13:45 নতুন টেস্ট যোগ হয়েছে	4.9	10.0	$0.038	তুলনা করুন
2026-05-22 00:18 স্যুইট পরিবর্তিত হয়েছে	4.9	10.0	$0.035	তুলনা করুন
2026-04-11 01:44 প্রথম নথিভুক্ত রান	5.1	প্রযোজ্য নয়	$0.032	বর্তমান রান

চার্ট

প্রথম মডেলটি নির্বাচন করুন, তারপর দ্বিতীয় মডেলে ক্লিক করে পাশাপাশি তুলনা পৃষ্ঠা খুলুন।

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

GPT-5.4 MininonevsTrinity Large Thinkingmedium GPT-5.4 MininonevsNorth Mini Codemediumবিনামূল্যে উপলভ্য GPT-5.4 MininonevsGPT-5.6 Terranone GPT-5.4 MininonevsKimi K2.6none GPT-5.4 MininonevsStep 3.5 Flashmedium GPT-5.4 MininonevsGPT-5.4none GPT-5.4 MininonevsTrinity Large Thinkinglow GPT-5.4 MininonevsNemotron 3 Supermediumবিনামূল্যে উপলভ্য GPT-5.4 MininonevsNemotron 3 Ultranoneবিনামূল্যে উপলভ্য GPT-5.4 MininonevsGLM 5none

বিভাগভিত্তিক বিশ্লেষণ

বিভাগ	স্কোর	ধারাবাহিকতা
অ্যান্টি-এআই কৌশল	3.1	8.1
কোডিং	10.0	10.0
সমন্বিত	3.0	10.0
ডেটা পার্সিং ও নিষ্কাশন	10.0	10.0
ডোমেইন-নির্দিষ্ট	3.5	4.4
Sadharon Buddhimotta	4.8	10.0
নির্দেশনা অনুসরণ	6.3	10.0
ধাঁধা সমাধান	5.4	10.0
টুল কলিং	3.0	10.0

GPT-5.4 Mini

Hamster playing table tennis

#93 GPT-5.4 Mini

চার্ট

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর vs মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

বিভাগভিত্তিক বিশ্লেষণ

তুলনা করা মডেল