#50
Mercury 2
Inception · প্রকাশ: 2026-02-24 · inception/mercury-2::none
গড় স্কোর
31
প্রতি ফলাফলে খরচ
0.196
ধারাবাহিকতা
89
মোট খরচ
$0.006
সঠিক টেস্ট
3
একটি টেস্ট তখনই সম্পূর্ণ পাস ধরা হবে যখন তার সব রান পাস করবে।
ভুল টেস্ট
12
প্রতি চেষ্টায় পাস রেট: 26.7%
অস্থির টেস্ট
2
প্রতিক্রিয়া সময়: গড় 594ms · মোট 8.91s · সর্বোচ্চ 1.27s
ভুল উত্তর: 11 নির্দেশনা অনুসরণ করা হয়নি: 1
স্কোর অনুযায়ী শীর্ষ মডেল
প্রথম মডেলটি নির্বাচন করুন, তারপর দ্বিতীয় মডেলে ক্লিক করে পাশাপাশি তুলনা পৃষ্ঠা খুলুন।
দ্রুত তুলনা
Mercury 2nonevsQwen3 Coder NextnoneMercury 2nonevsQwen3 Coder NextmediumMercury 2nonevsKimi K2.5noneMercury 2nonevsGrok 4.1 FastnoneMercury 2nonevsGLM 4.7 FlashnoneMercury 2nonevsGLM 4.7 FlashmediumMercury 2nonevsGemini 3 Flash PreviewmediumMercury 2nonevsGemini 3.1 Pro PreviewmediumMercury 2nonevsStep 3.5 Flashmediumবিনামূল্যে উপলভ্য
বিভাগভিত্তিক বিশ্লেষণ
| বিভাগ | গড় স্কোর | ধারাবাহিকতা | সঠিক টেস্ট |
|---|---|---|---|
| Anti-AI Tricks | 100 | 100 | 0/3 |
| Combined | 100 | 100 | 0/1 |
| Data parsing and extraction | 55 | 59 | 1/2 |
| Domain specific | 40 | 72 | 1/3 |
| Instructions following | 35 | 100 | 0/2 |
| Puzzle Solving | 100 | 100 | 0/3 |
| Tool Calling | 100 | 100 | 1/1 |