AI BENCHY
Advertise here

#7

GPT-5.3-Codex

OpenAI প্রকাশ: 2026-02-05 পরীক্ষিত হয়েছে: 2026-04-11 01:44 openai/gpt-5.3-codex::medium

ধারাবাহিকতা

8.7

নির্ভরযোগ্যতা

প্রযোজ্য নয়

মোট আউটপুট টোকেন

37,458

???? ???

$1.750 / 1M

????? ???

$14.000 / 1M

সঠিক টেস্ট

ভুল টেস্ট: 5

প্রতি চেষ্টায় পাস রেট: 83.3%

অস্থির টেস্ট

3

অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।

প্রতিক্রিয়া সময় (গড়)

15.38s

প্রতিক্রিয়া সময় (সর্বোচ্চ): 100.93s

প্রতিক্রিয়া সময় (মোট): 276.91s

রান ইতিহাস

পরীক্ষিত হয়েছে স্কোর নির্ভরযোগ্যতা সঠিক টেস্ট মোট খরচ তুলনা করুন
2026-05-22 00:19 পুনরায় পরীক্ষা 8.3 10.0 $0.685 তুলনা করুন
2026-04-11 01:44 প্রথম নথিভুক্ত রান 8.6 প্রযোজ্য নয় $0.573 বর্তমান রান

চার্ট

প্রথম মডেলটি নির্বাচন করুন, তারপর দ্বিতীয় মডেলে ক্লিক করে পাশাপাশি তুলনা পৃষ্ঠা খুলুন।

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

বিভাগভিত্তিক বিশ্লেষণ

বিভাগ স্কোর ধারাবাহিকতা সঠিক টেস্ট
অ্যান্টি-এআই কৌশল 8.7 7.9
কোডিং 10.0 10.0
সমন্বিত 10.0 10.0
ডেটা পার্সিং ও নিষ্কাশন 10.0 10.0
ডোমেইন-নির্দিষ্ট 5.9 7.2
Sadharon Buddhimotta 4.6 10.0
নির্দেশনা অনুসরণ 10.0 10.0
ধাঁধা সমাধান 9.0 7.9
টুল কলিং 10.0 10.0

তুলনা করা মডেল