#91
OpenAI
প্রকাশ: 2025-08-05
পরীক্ষিত হয়েছে: 2026-04-21 12:42
openai/gpt-oss-120b::none
(medium)
(none)
???? ???
$0.000 / 1M
????? ???
$0.000 / 1M
অস্থির টেস্ট
5
অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।
11.96s
প্রতিক্রিয়া সময় (সর্বোচ্চ): 68.97s
প্রতিক্রিয়া সময় (মোট): 179.34s
রান ইতিহাস
| পরীক্ষিত হয়েছে | স্কোর | নির্ভরযোগ্যতা | সঠিক টেস্ট | মোট খরচ | তুলনা করুন |
|---|---|---|---|---|---|
| 2026-05-08 15:31 স্যুইট পরিবর্তিত হয়েছে | 5.2 | 10.0 | $0.011 | তুলনা করুন | |
| 2026-04-21 12:42 প্রথম নথিভুক্ত রান | 5.2 | প্রযোজ্য নয় | $0.009 | বর্তমান রান |
রান তুলনা
| রান | স্কোর | ধারাবাহিকতা | নির্ভরযোগ্যতা | সঠিক টেস্ট | অস্থির টেস্ট | মোট আউটপুট টোকেন | মোট খরচ | প্রতিক্রিয়া সময় (গড়) |
|---|---|---|---|---|---|---|---|---|
| 2026-04-21 12:42 · প্রথম নথিভুক্ত রান | 5.2 | 7.9 | প্রযোজ্য নয় | 4/18 | 5 | 44,652 | $0.009 | 11.96s |
| 2026-05-08 15:31 · স্যুইট পরিবর্তিত হয়েছে | 5.2 | 8.7 | 10.0 | 5/19 | 3 | 51,505 | $0.011 | 21.86s |
| পার্থক্য | 0.0 | -0.8 | -1 | +2 | -6853 | -$0.002 | -9905ms |
এই দুই রান ভিন্ন বেঞ্চমার্ক স্যুইট ব্যবহার করেছে, তাই পার্থক্যগুলোতে মডেল পরিবর্তন এবং স্যুইট পরিবর্তন দুটোই ধরা পড়ে।
চার্ট
প্রথম মডেলটি নির্বাচন করুন, তারপর দ্বিতীয় মডেলে ক্লিক করে পাশাপাশি তুলনা পৃষ্ঠা খুলুন।
স্কোর vs মোট খরচ
প্রতিক্রিয়া সময় (গড়)
স্কোর vs প্রতিক্রিয়া সময় (গড়)
মোট আউটপুট টোকেন
স্কোর vs মোট আউটপুট টোকেন
দ্রুত তুলনা
gpt-oss-120bnoneবিনামূল্যে উপলভ্যvsGLM 4.7 Flashnonegpt-oss-120bnoneবিনামূল্যে উপলভ্যvsgpt-oss-120bmediumবিনামূল্যে উপলভ্যgpt-oss-120bnoneবিনামূল্যে উপলভ্যvsGPT-5.4nonegpt-oss-120bnoneবিনামূল্যে উপলভ্যvsMiMo-V2-Prononegpt-oss-120bnoneবিনামূল্যে উপলভ্যvsGLM 5.1nonegpt-oss-120bnoneবিনামূল্যে উপলভ্যvsGemini 3 Flash Previewmediumgpt-oss-120bnoneবিনামূল্যে উপলভ্যvsGemini 3.5 Flashhighgpt-oss-120bnoneবিনামূল্যে উপলভ্যvsRing-2.6-1Tmediumgpt-oss-120bnoneবিনামূল্যে উপলভ্যvsGemini 3.5 Flashlow
বিভাগভিত্তিক বিশ্লেষণ
| বিভাগ | স্কোর | ধারাবাহিকতা | সঠিক টেস্ট |
|---|---|---|---|
| অ্যান্টি-এআই কৌশল | 6.6 | 8.0 | |
| কোডিং | 4.3 | 1.1 | |
| সমন্বিত | 3.0 | 10.0 | |
| ডেটা পার্সিং ও নিষ্কাশন | 6.5 | 10.0 | |
| ডোমেইন-নির্দিষ্ট | 3.0 | 10.0 | |
| Sadharon Buddhimotta | 4.6 | 10.0 | |
| নির্দেশনা অনুসরণ | 8.4 | 6.9 | |
| ধাঁধা সমাধান | 4.5 | 4.8 | |
| টুল কলিং | 3.0 | 10.0 |