#136

GPT-5.4 Mini

OpenAI প্রকাশ: 2026-03-17 পরীক্ষিত হয়েছে: 2026-05-22 00:18 openai/gpt-5.4-mini::none

(medium) (none)

সারাংশ

GPT-5.4 Mini AI BENCHY-তে 4.9 স্কোর করে এবং #136 স্থানে আছে। এর reliability 10.0, pass rate 31.7%, মোট খরচ $0.035, এবং গড় response time 1.16s.

GPT-5.4 Mini কে আলাদা করে যা: এটি কোডিং-তে সবচেয়ে ভালোভাবে নজর কাড়ে, যেখানে এর rank #2; আর টুল কলিং এর দুর্বলতম ক্ষেত্র, rank #16. একই ধরনের মডেলের তুলনায় এটি লক্ষণীয়ভাবে দ্রুত।

স্কোর

4.9

ধারাবাহিকতা

8.8

নির্ভরযোগ্যতা

10.0

মোট খরচ (বর্তমান মূল্য)

$0.035

মোট আউটপুট টোকেন

2,496

মোট ইনপুট টোকেন

ইনপুট মূল্য

$0.750 / 1M

আউটপুট মূল্য

$4.500 / 1M

সঠিক টেস্ট

ভুল টেস্ট: 15

প্রতি চেষ্টায় পাস রেট: 31.7%

অস্থির টেস্ট

অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।

প্রতিক্রিয়া সময় (গড়)

1.16s

প্রতিক্রিয়া সময় (সর্বোচ্চ): 2.52s

প্রতিক্রিয়া সময় (মোট): 23.16s

ভুল উত্তর: 12 নির্দেশনা অনুসরণ করা হয়নি: 3

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#136 GPT-5.4 Mini

none

খরচ: $0.010
সময়: 11.7s
টোকেন: 2,151 tok

রান ইতিহাস

পরীক্ষিত হয়েছে	স্কোর	নির্ভরযোগ্যতা	মোট খরচ	তুলনা করুন
2026-07-16 22:33 নতুন টেস্ট যোগ হয়েছে	5.9	10.0	$0.095	তুলনা করুন
2026-06-04 13:45 নতুন টেস্ট যোগ হয়েছে	4.9	10.0	$0.038	তুলনা করুন
2026-05-22 00:18 স্যুইট পরিবর্তিত হয়েছে	4.9	10.0	$0.035	বর্তমান রান
2026-04-11 01:44 প্রথম নথিভুক্ত রান	5.1	প্রযোজ্য নয়	$0.032	তুলনা করুন

এই রানটি ভিন্ন একটি বেঞ্চমার্ক স্যুইট ব্যবহার করেছে। ঐতিহাসিক পরিবর্তন পড়ার সময় স্যুইট পরিবর্তনও মাথায় রাখুন।

চার্ট

প্রথম মডেলটি নির্বাচন করুন, তারপর দ্বিতীয় মডেলে ক্লিক করে পাশাপাশি তুলনা পৃষ্ঠা খুলুন।

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

GPT-5.4 MininonevsTrinity Large Thinkingmedium GPT-5.4 MininonevsNorth Mini Codemediumবিনামূল্যে উপলভ্য GPT-5.4 MininonevsGPT-5.6 Terranone GPT-5.4 MininonevsKimi K2.6none GPT-5.4 MininonevsStep 3.5 Flashmedium GPT-5.4 MininonevsGPT-5.4none GPT-5.4 MininonevsTrinity Large Thinkinglow GPT-5.4 MininonevsNemotron 3 Supermediumবিনামূল্যে উপলভ্য GPT-5.4 MininonevsNemotron 3 Ultranoneবিনামূল্যে উপলভ্য GPT-5.4 MininonevsGLM 5none

বিভাগভিত্তিক বিশ্লেষণ

বিভাগ	স্কোর	ধারাবাহিকতা
অ্যান্টি-এআই কৌশল	3.1	8.1
কোডিং	6.8	10.0
সমন্বিত	3.0	10.0
ডেটা পার্সিং ও নিষ্কাশন	10.0	10.0
ডোমেইন-নির্দিষ্ট	3.5	4.4
Sadharon Buddhimotta	4.8	10.0
নির্দেশনা অনুসরণ	6.3	10.0
ধাঁধা সমাধান	5.4	10.0
টুল কলিং	3.0	10.0
সাধারণ জ্ঞান	3.0	10.0

GPT-5.4 Mini

Hamster playing table tennis

#136 GPT-5.4 Mini

চার্ট

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর vs মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

বিভাগভিত্তিক বিশ্লেষণ

তুলনা করা মডেল