AI BENCHY
Advertise here

#99

Mercury 2

Inception প্রকাশ: 2026-02-24 পরীক্ষিত হয়েছে: 2026-04-11 01:44 inception/mercury-2::none
(medium) (none)

ধারাবাহিকতা

9.0

নির্ভরযোগ্যতা

প্রযোজ্য নয়

মোট আউটপুট টোকেন

1,625

মোট ইনপুট টোকেন

0

ইনপুট মূল্য

$0.250 / 1M

আউটপুট মূল্য

$0.750 / 1M

সঠিক টেস্ট

ভুল টেস্ট: 14

প্রতি চেষ্টায় পাস রেট: 27.8%

অস্থির টেস্ট

2

অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।

প্রতিক্রিয়া সময় (গড়)

613ms

প্রতিক্রিয়া সময় (সর্বোচ্চ): 1.27s

প্রতিক্রিয়া সময় (মোট): 11.04s

রান ইতিহাস

পরীক্ষিত হয়েছে স্কোর নির্ভরযোগ্যতা সঠিক টেস্ট মোট খরচ তুলনা করুন
2026-05-22 00:39 স্যুইট পরিবর্তিত হয়েছে 4.6 10.0 $0.009 তুলনা করুন
2026-04-11 01:44 প্রথম নথিভুক্ত রান 4.8 প্রযোজ্য নয় $0.007 বর্তমান রান

চার্ট

প্রথম মডেলটি নির্বাচন করুন, তারপর দ্বিতীয় মডেলে ক্লিক করে পাশাপাশি তুলনা পৃষ্ঠা খুলুন।

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

বিভাগভিত্তিক বিশ্লেষণ

বিভাগ স্কোর ধারাবাহিকতা সঠিক টেস্ট
অ্যান্টি-এআই কৌশল 3.0 10.0
কোডিং 3.6 8.9
সমন্বিত 3.0 10.0
ডেটা পার্সিং ও নিষ্কাশন 7.3 5.9
ডোমেইন-নির্দিষ্ট 5.3 7.2
Sadharon Buddhimotta 4.8 10.0
নির্দেশনা অনুসরণ 6.5 10.0
ধাঁধা সমাধান 3.1 10.0
টুল কলিং 10.0 10.0

তুলনা করা মডেল