নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Inception: Mercury 2 vs Qwen: Qwen3.5-122B-A10B

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-06-03

মেট্রিক Mercury 2 Mercury 2 none প্রকাশ: 2026-02-24 Qwen3.5-122B-A10B Qwen3.5-122B-A10B none প্রকাশ: 2026-02-24
স্কোর 4.6 5.4
র‍্যাঙ্ক #153 #131
নির্ভরযোগ্যতা 10.0 10.0
ধারাবাহিকতা 9.1 9.5
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 25.0% 33.3%
অস্থির টেস্ট 2 1
মোট রান 60 60
প্রতি ফলাফলে খরচ 0.216 0.380
মোট খরচ $0.009 $0.019
ইনপুট মূল্য $0.250 / 1M $0.260 / 1M
আউটপুট মূল্য $0.750 / 1M $2.080 / 1M
মোট ইনপুট টোকেন 25,515 44,894
আউটপুট টোকেন 3,001 3,374
রিজনিং টোকেন 0 0
প্রতিক্রিয়া সময় (গড়) 614ms 3.38s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 1.27s 46.00s
প্রতিক্রিয়া সময় (মোট) 12.28s 67.55s

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 3.0 10.0 0.0% 0 483ms 631 286 0
Qwen3.5-122B-A10B 4.8 10.0 25.0% 0 1.59s 696 312 0
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 3.5 9.4 0.0% 0 831ms 4,631 1,650 0
Qwen3.5-122B-A10B 4.0 5.5 33.3% 1 2.14s 5,072 684 0
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 3.0 10.0 0.0% 0 606ms 4,821 131 0
Qwen3.5-122B-A10B 3.0 10.0 0.0% 0 46.00s 20,175 1,137 0
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 7.3 5.9 83.3% 1 667ms 6,362 180 0
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 1.01s 7,794 243 0
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 5.3 7.2 44.4% 1 534ms 784 46 0
Qwen3.5-122B-A10B 5.3 10.0 33.3% 0 465ms 789 15 0
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 4.8 10.0 0.0% 0 628ms 495 159 0
Qwen3.5-122B-A10B 5.0 10.0 0.0% 0 1.12s 522 66 0
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 6.5 10.0 50.0% 0 551ms 691 82 0
Qwen3.5-122B-A10B 6.3 10.0 50.0% 0 513ms 711 69 0
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 3.1 10.0 0.0% 0 535ms 694 251 0
Qwen3.5-122B-A10B 3.8 10.0 0.0% 0 1.00s 714 575 0
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 10.0 10.0 100.0% 0 1.27s 6,193 197 0
Qwen3.5-122B-A10B 10.0 10.0 100.0% 0 2.04s 8,211 264 0
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 3.0 10.0 0.0% 0 548ms 213 19 0
Qwen3.5-122B-A10B 3.0 10.0 0.0% 0 295ms 210 9 0

দ্রুত তুলনা

তুলনার জুটি বদলান