#71
OpenAI
প্রকাশ: 2026-03-05
পরীক্ষিত হয়েছে: 2026-04-11 01:44
openai/gpt-5.4::none
(medium)
(none)
5.9
ধারাবাহিকতা
9.1
প্রযোজ্য নয়
$0.104
মোট আউটপুট টোকেন
2,317
মোট ইনপুট টোকেন
0
ইনপুট মূল্য
$2.500 / 1M
আউটপুট মূল্য
$15.000 / 1M
অস্থির টেস্ট
2
অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।
রান ইতিহাস
| পরীক্ষিত হয়েছে | স্কোর | নির্ভরযোগ্যতা | সঠিক টেস্ট | মোট খরচ | তুলনা করুন |
|---|---|---|---|---|---|
| 2026-05-22 00:18 স্যুইট পরিবর্তিত হয়েছে | 5.6 | 10.0 | $0.115 | তুলনা করুন | |
| 2026-04-11 01:44 প্রথম নথিভুক্ত রান | 5.9 | প্রযোজ্য নয় | $0.104 | বর্তমান রান |
রান তুলনা
| রান | স্কোর | ধারাবাহিকতা | নির্ভরযোগ্যতা | সঠিক টেস্ট | অস্থির টেস্ট | মোট আউটপুট টোকেন | মোট ইনপুট টোকেন | মোট খরচ | প্রতিক্রিয়া সময় (গড়) |
|---|---|---|---|---|---|---|---|---|---|
| 2026-04-11 01:44 · প্রথম নথিভুক্ত রান | 5.9 | 9.1 | প্রযোজ্য নয় | 7/18 | 2 | 2,317 | 0 | $0.104 | 1.51s |
| 2026-05-22 00:18 · স্যুইট পরিবর্তিত হয়েছে | 5.6 | 9.1 | 10.0 | 7/20 | 2 | 2,378 | 0 | $0.115 | 1.46s |
| পার্থক্য | +0.3 | 0.0 | 0 | 0 | -61 | 0 | -$0.012 | +50ms |
এই দুই রান ভিন্ন বেঞ্চমার্ক স্যুইট ব্যবহার করেছে, তাই পার্থক্যগুলোতে মডেল পরিবর্তন এবং স্যুইট পরিবর্তন দুটোই ধরা পড়ে।
চার্ট
প্রথম মডেলটি নির্বাচন করুন, তারপর দ্বিতীয় মডেলে ক্লিক করে পাশাপাশি তুলনা পৃষ্ঠা খুলুন।
স্কোর vs মোট খরচ
প্রতিক্রিয়া সময় (গড়)
স্কোর vs প্রতিক্রিয়া সময় (গড়)
মোট আউটপুট টোকেন
স্কোর vs মোট আউটপুট টোকেন
দ্রুত তুলনা
GPT-5.4nonevsgpt-oss-120bmediumবিনামূল্যে উপলভ্যGPT-5.4nonevsGLM 5V TurbononeGPT-5.4nonevsNemotron 3 Supermediumবিনামূল্যে উপলভ্যGPT-5.4nonevsSeed-2.0-LitenoneGPT-5.4nonevsOwl AlphamediumGPT-5.4nonevsGemini 3 Flash PreviewmediumGPT-5.4nonevsGemini 3.5 FlashhighGPT-5.4nonevsRing-2.6-1TmediumGPT-5.4nonevsGemini 3.5 Flashlow
বিভাগভিত্তিক বিশ্লেষণ
| বিভাগ | স্কোর | ধারাবাহিকতা | সঠিক টেস্ট |
|---|---|---|---|
| অ্যান্টি-এআই কৌশল | 3.2 | 8.0 | |
| কোডিং | 10.0 | 10.0 | |
| সমন্বিত | 3.0 | 10.0 | |
| ডেটা পার্সিং ও নিষ্কাশন | 10.0 | 10.0 | |
| ডোমেইন-নির্দিষ্ট | 5.3 | 7.2 | |
| Sadharon Buddhimotta | 4.4 | 9.9 | |
| নির্দেশনা অনুসরণ | 6.5 | 10.0 | |
| ধাঁধা সমাধান | 5.6 | 9.8 | |
| টুল কলিং | 10.0 | 10.0 |