AI BENCHY
Advertise here

#27

GPT-5.4

OpenAI প্রকাশ: 2026-03-05 পরীক্ষিত হয়েছে: 2026-05-22 00:19 openai/gpt-5.4::medium
(medium) (none)

ধারাবাহিকতা

8.5

মোট আউটপুট টোকেন

70,707

মোট ইনপুট টোকেন

31,489

ইনপুট মূল্য

$2.500 / 1M

আউটপুট মূল্য

$15.000 / 1M

সঠিক টেস্ট

ভুল টেস্ট: 7

প্রতি চেষ্টায় পাস রেট: 75.0%

অস্থির টেস্ট

4

অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।

প্রতিক্রিয়া সময় (গড়)

22.31s

প্রতিক্রিয়া সময় (সর্বোচ্চ): 100.41s

প্রতিক্রিয়া সময় (মোট): 446.17s

রান ইতিহাস

পরীক্ষিত হয়েছে স্কোর নির্ভরযোগ্যতা সঠিক টেস্ট মোট খরচ তুলনা করুন
2026-05-22 00:19 স্যুইট পরিবর্তিত হয়েছে 7.9 10.0 $1.140 বর্তমান রান
2026-04-11 01:44 প্রথম নথিভুক্ত রান 8.2 প্রযোজ্য নয় $0.832 তুলনা করুন

এই রানটি ভিন্ন একটি বেঞ্চমার্ক স্যুইট ব্যবহার করেছে। ঐতিহাসিক পরিবর্তন পড়ার সময় স্যুইট পরিবর্তনও মাথায় রাখুন।

রান তুলনা

রানস্কোরধারাবাহিকতানির্ভরযোগ্যতাসঠিক টেস্টঅস্থির টেস্টমোট আউটপুট টোকেনমোট ইনপুট টোকেনমোট খরচপ্রতিক্রিয়া সময় (গড়)
2026-05-22 00:19 · বর্তমান রান7.98.510.013/20470,70731,489$1.14022.31s
2026-04-11 01:44 · প্রথম নথিভুক্ত রান8.28.7প্রযোজ্য নয়13/18350,9010$0.83218.63s
পার্থক্য-0.3-0.20+1+19806+31489+$0.308+3683ms

এই দুই রান ভিন্ন বেঞ্চমার্ক স্যুইট ব্যবহার করেছে, তাই পার্থক্যগুলোতে মডেল পরিবর্তন এবং স্যুইট পরিবর্তন দুটোই ধরা পড়ে।

মূল্যের ইতিহাস

OpenRouter থেকে এই মডেলের ঐতিহাসিক মূল্য তথ্য।

তারিখ ইনপুট মূল্য আউটপুট মূল্য
2026-06-03 21:35 $2.500 / 1M $15.000 / 1M

চার্ট

প্রথম মডেলটি নির্বাচন করুন, তারপর দ্বিতীয় মডেলে ক্লিক করে পাশাপাশি তুলনা পৃষ্ঠা খুলুন।

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

বিভাগভিত্তিক বিশ্লেষণ

বিভাগ স্কোর ধারাবাহিকতা সঠিক টেস্ট
অ্যান্টি-এআই কৌশল 8.3 10.0
কোডিং 8.2 6.7
সমন্বিত 10.0 10.0
ডেটা পার্সিং ও নিষ্কাশন 10.0 10.0
ডোমেইন-নির্দিষ্ট 5.3 7.2
Sadharon Buddhimotta 4.7 3.1
নির্দেশনা অনুসরণ 10.0 10.0
ধাঁধা সমাধান 8.2 7.2
টুল কলিং 10.0 10.0
সাধারণ জ্ঞান 3.0 10.0

তুলনা করা মডেল