AI BENCHY
Advertise here

#129

gpt-oss-120b

OpenAI প্রকাশ: 2025-08-05 পরীক্ষিত হয়েছে: 2026-05-08 15:31 openai/gpt-oss-120b::none
(medium) (none)

ধারাবাহিকতা

8.7

মোট আউটপুট টোকেন

51,505

???? ???

$0.000 / 1M

????? ???

$0.000 / 1M

সঠিক টেস্ট

ভুল টেস্ট: 14

প্রতি চেষ্টায় পাস রেট: 36.8%

অস্থির টেস্ট

3

অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।

প্রতিক্রিয়া সময় (গড়)

21.86s

প্রতিক্রিয়া সময় (সর্বোচ্চ): 113.71s

প্রতিক্রিয়া সময় (মোট): 349.78s

রান ইতিহাস

পরীক্ষিত হয়েছে স্কোর নির্ভরযোগ্যতা সঠিক টেস্ট মোট খরচ তুলনা করুন
2026-05-08 15:31 স্যুইট পরিবর্তিত হয়েছে 5.2 10.0 $0.011 বর্তমান রান
2026-04-21 12:42 প্রথম নথিভুক্ত রান 5.2 প্রযোজ্য নয় $0.009 তুলনা করুন

এই রানটি ভিন্ন একটি বেঞ্চমার্ক স্যুইট ব্যবহার করেছে। ঐতিহাসিক পরিবর্তন পড়ার সময় স্যুইট পরিবর্তনও মাথায় রাখুন।

চার্ট

প্রথম মডেলটি নির্বাচন করুন, তারপর দ্বিতীয় মডেলে ক্লিক করে পাশাপাশি তুলনা পৃষ্ঠা খুলুন।

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

বিভাগভিত্তিক বিশ্লেষণ

বিভাগ স্কোর ধারাবাহিকতা সঠিক টেস্ট
অ্যান্টি-এআই কৌশল 6.5 10.0
কোডিং 4.3 1.1
সমন্বিত 3.0 10.0
ডেটা পার্সিং ও নিষ্কাশন 6.5 10.0
ডোমেইন-নির্দিষ্ট 3.0 10.0
Sadharon Buddhimotta 4.8 10.0
নির্দেশনা অনুসরণ 9.8 10.0
ধাঁধা সমাধান 4.4 4.5
টুল কলিং 3.0 10.0
সাধারণ জ্ঞান 3.0 10.0

তুলনা করা মডেল