#40
Mercury 2
Inception · প্রকাশ: 2026-02-24 · inception/mercury-2::medium
গড় স্কোর
48
প্রতি ফলাফলে খরচ
0.726
ধারাবাহিকতা
83
মোট খরচ
$0.044
সঠিক টেস্ট
6
একটি টেস্ট তখনই সম্পূর্ণ পাস ধরা হবে যখন তার সব রান পাস করবে।
ভুল টেস্ট
9
প্রতি চেষ্টায় পাস রেট: 51.1%
অস্থির টেস্ট
3
প্রতিক্রিয়া সময়: গড় 2.47s · মোট 34.56s · সর্বোচ্চ 14.63s
ভুল উত্তর: 5 নির্দেশনা অনুসরণ করা হয়নি: 3 API ত্রুটি: 1
স্কোর অনুযায়ী শীর্ষ মডেল
প্রথম মডেলটি নির্বাচন করুন, তারপর দ্বিতীয় মডেলে ক্লিক করে পাশাপাশি তুলনা পৃষ্ঠা খুলুন।
দ্রুত তুলনা
Mercury 2mediumvsQwen3.5-122B-A10BnoneMercury 2mediumvsQwen3.5-FlashnoneMercury 2mediumvsDeepSeek V3.2noneMercury 2mediumvsMiniMax M2.5mediumMercury 2mediumvsQwen3.5-27BnoneMercury 2mediumvsQwen3.5-35B-A3BnoneMercury 2mediumvsGemini 3 Flash PreviewmediumMercury 2mediumvsGemini 3.1 Pro PreviewmediumMercury 2mediumvsStep 3.5 Flashmediumবিনামূল্যে উপলভ্য
বিভাগভিত্তিক বিশ্লেষণ
| বিভাগ | গড় স্কোর | ধারাবাহিকতা | সঠিক টেস্ট |
|---|---|---|---|
| Anti-AI Tricks | 73 | 98 | 2/3 |
| Combined | 100 | 100 | 1/1 |
| Data parsing and extraction | 55 | 59 | 1/2 |
| Domain specific | 100 | 72 | 0/3 |
| Instructions following | 55 | 100 | 1/2 |
| Puzzle Solving | 17 | 75 | 0/3 |
| Tool Calling | 100 | 100 | 1/1 |