#50
OpenAI
প্রকাশ: 2025-08-07
পরীক্ষিত হয়েছে: 2026-04-11 01:44
openai/gpt-5-mini::medium
7.0
ধারাবাহিকতা
8.6
প্রযোজ্য নয়
$0.128
মোট আউটপুট টোকেন
59,861
মোট ইনপুট টোকেন
0
ইনপুট মূল্য
$0.250 / 1M
আউটপুট মূল্য
$2.000 / 1M
অস্থির টেস্ট
3
অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।
23.98s
প্রতিক্রিয়া সময় (সর্বোচ্চ): 88.15s
প্রতিক্রিয়া সময় (মোট): 431.56s
রান ইতিহাস
| পরীক্ষিত হয়েছে | স্কোর | নির্ভরযোগ্যতা | সঠিক টেস্ট | মোট খরচ | তুলনা করুন |
|---|---|---|---|---|---|
| 2026-05-22 00:16 পুনরায় পরীক্ষা | 6.9 | 10.0 | $0.150 | তুলনা করুন | |
| 2026-04-11 01:44 প্রথম নথিভুক্ত রান | 7.0 | প্রযোজ্য নয় | $0.128 | বর্তমান রান |
রান তুলনা
| রান | স্কোর | ধারাবাহিকতা | নির্ভরযোগ্যতা | সঠিক টেস্ট | অস্থির টেস্ট | মোট আউটপুট টোকেন | মোট ইনপুট টোকেন | মোট খরচ | প্রতিক্রিয়া সময় (গড়) |
|---|---|---|---|---|---|---|---|---|---|
| 2026-04-11 01:44 · প্রথম নথিভুক্ত রান | 7.0 | 8.6 | প্রযোজ্য নয় | 9/18 | 3 | 59,861 | 0 | $0.128 | 23.98s |
| 2026-05-22 00:16 · পুনরায় পরীক্ষা | 6.9 | 8.7 | 10.0 | 10/20 | 3 | 70,358 | 0 | $0.150 | 23.99s |
| পার্থক্য | +0.1 | -0.1 | -1 | 0 | -10497 | 0 | -$0.023 | -17ms |
এই দুই রান ভিন্ন বেঞ্চমার্ক স্যুইট ব্যবহার করেছে, তাই পার্থক্যগুলোতে মডেল পরিবর্তন এবং স্যুইট পরিবর্তন দুটোই ধরা পড়ে।
চার্ট
প্রথম মডেলটি নির্বাচন করুন, তারপর দ্বিতীয় মডেলে ক্লিক করে পাশাপাশি তুলনা পৃষ্ঠা খুলুন।
স্কোর vs মোট খরচ
প্রতিক্রিয়া সময় (গড়)
স্কোর vs প্রতিক্রিয়া সময় (গড়)
মোট আউটপুট টোকেন
স্কোর vs মোট আউটপুট টোকেন
দ্রুত তুলনা
GPT-5 MinimediumvsGLM 5V TurbomediumGPT-5 MinimediumvsGPT-5.4 MinimediumGPT-5 MinimediumvsStep 3.5 FlashmediumGPT-5 MinimediumvsMiniMax M3mediumGPT-5 MinimediumvsKimi K2.6mediumবিনামূল্যে উপলভ্যGPT-5 MinimediumvsClaude Opus 4.8noneGPT-5 MinimediumvsGemini 3 Flash PreviewmediumGPT-5 MinimediumvsGemini 3.5 FlashhighGPT-5 MinimediumvsRing-2.6-1TmediumGPT-5 MinimediumvsGemini 3.5 Flashlow
বিভাগভিত্তিক বিশ্লেষণ
| বিভাগ | স্কোর | ধারাবাহিকতা | সঠিক টেস্ট |
|---|---|---|---|
| অ্যান্টি-এআই কৌশল | 7.1 | 7.6 | |
| কোডিং | 10.0 | 10.0 | |
| সমন্বিত | 10.0 | 10.0 | |
| ডেটা পার্সিং ও নিষ্কাশন | 10.0 | 10.0 | |
| ডোমেইন-নির্দিষ্ট | 3.6 | 7.2 | |
| Sadharon Buddhimotta | 4.5 | 10.0 | |
| নির্দেশনা অনুসরণ | 8.0 | 6.6 | |
| ধাঁধা সমাধান | 5.6 | 9.8 | |
| টুল কলিং | 10.0 | 10.0 |