AI BENCHY
Advertise here

#153

Mercury 2

Inception প্রকাশ: 2026-02-24 পরীক্ষিত হয়েছে: 2026-05-22 00:39 inception/mercury-2::none
(medium) (none)

ধারাবাহিকতা

9.1

মোট আউটপুট টোকেন

3,001

মোট ইনপুট টোকেন

25,515

ইনপুট মূল্য

$0.250 / 1M

আউটপুট মূল্য

$0.750 / 1M

সঠিক টেস্ট

ভুল টেস্ট: 16

প্রতি চেষ্টায় পাস রেট: 25.0%

অস্থির টেস্ট

2

অস্থির টেস্টে রানভেদে মিশ্র ফল হয়েছে (কমপক্ষে একটি পাস এবং একটি ফেল)।

প্রতিক্রিয়া সময় (গড়)

614ms

প্রতিক্রিয়া সময় (সর্বোচ্চ): 1.27s

প্রতিক্রিয়া সময় (মোট): 12.28s

রান ইতিহাস

পরীক্ষিত হয়েছে স্কোর নির্ভরযোগ্যতা সঠিক টেস্ট মোট খরচ তুলনা করুন
2026-05-22 00:39 স্যুইট পরিবর্তিত হয়েছে 4.6 10.0 $0.009 বর্তমান রান
2026-04-11 01:44 প্রথম নথিভুক্ত রান 4.8 প্রযোজ্য নয় $0.007 তুলনা করুন

এই রানটি ভিন্ন একটি বেঞ্চমার্ক স্যুইট ব্যবহার করেছে। ঐতিহাসিক পরিবর্তন পড়ার সময় স্যুইট পরিবর্তনও মাথায় রাখুন।

মূল্যের ইতিহাস

OpenRouter থেকে এই মডেলের ঐতিহাসিক মূল্য তথ্য।

তারিখ ইনপুট মূল্য আউটপুট মূল্য
2026-06-03 21:35 $0.250 / 1M $0.750 / 1M

চার্ট

প্রথম মডেলটি নির্বাচন করুন, তারপর দ্বিতীয় মডেলে ক্লিক করে পাশাপাশি তুলনা পৃষ্ঠা খুলুন।

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

দ্রুত তুলনা

বিভাগভিত্তিক বিশ্লেষণ

বিভাগ স্কোর ধারাবাহিকতা সঠিক টেস্ট
অ্যান্টি-এআই কৌশল 3.0 10.0
কোডিং 3.5 9.4
সমন্বিত 3.0 10.0
ডেটা পার্সিং ও নিষ্কাশন 7.3 5.9
ডোমেইন-নির্দিষ্ট 5.3 7.2
Sadharon Buddhimotta 4.8 10.0
নির্দেশনা অনুসরণ 6.5 10.0
ধাঁধা সমাধান 3.1 10.0
টুল কলিং 10.0 10.0
সাধারণ জ্ঞান 3.0 10.0

তুলনা করা মডেল