নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Inception: Mercury 2 vs Qwen: Qwen3.6 35B A3B

সারাংশ

Mercury 2 vs Qwen3.6 35B A3B benchmark তুলনা: Qwen3.6 35B A3B average score-এ এগিয়ে: 5.2 vs 4.6. Mercury 2-এর benchmark খরচ কম: $0.011 vs $0.031. Mercury 2 দ্রুত: 653ms vs 3.73s, pass rates 23.8% vs 30.2%.

প্রস্তাবিত মডেল: Mercury 2 - Its score stays close to the best score here (4.6 vs 5.2), while costing about 2.9x less than Qwen3.6 35B A3B.

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-06-18

মেট্রিক Mercury 2 Mercury 2 none প্রকাশ: 2026-02-24 Qwen3.6 35B A3B Qwen3.6 35B A3B none প্রকাশ: 2026-04-20
স্কোর 4.6 5.2
র‍্যাঙ্ক #151 #128
নির্ভরযোগ্যতা 10.0 10.0
ধারাবাহিকতা 9.2 8.0
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 23.8% 30.2%
অস্থির টেস্ট 2 5
মোট রান 63 63
প্রতি ফলাফলে খরচ 0.259 0.754
মোট খরচ $0.011 $0.031
ইনপুট মূল্য $0.250 / 1M $0.140 / 1M
আউটপুট মূল্য $0.750 / 1M $1.000 / 1M
মোট ইনপুট টোকেন 28,113 19,329
আউটপুট টোকেন 4,439 27,755
রিজনিং টোকেন 0 0
প্রতিক্রিয়া সময় (গড়) 653ms 3.73s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 1.43s 22.52s
প্রতিক্রিয়া সময় (মোট) 13.72s 70.86s

জেনারেশন শোকেস

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#151 Mercury 2

none
খরচ
$0.002
সময়
1.8s
টোকেন
1,514 tok

#128 Qwen3.6 35B A3B

none
খরচ
$0.008
সময়
30.1s
টোকেন
6,317 tok

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 3.0 10.0 0.0% 0 483ms 631 286 0
Qwen3.6 35B A3B 3.6 7.6 16.7% 1 2.10s 696 1,571 0
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 3.4 9.6 0.0% 0 1.03s 7,229 3,088 0
Qwen3.6 35B A3B 5.5 10.0 33.3% 0 8.77s 7,911 11,161 0
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 3.0 10.0 0.0% 0 606ms 4,821 131 0
Qwen3.6 35B A3B 3.0 10.0 0.0% 0 0ms 0 0 0
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 7.3 5.9 83.3% 1 667ms 6,362 180 0
Qwen3.6 35B A3B 10.0 10.0 100.0% 0 1.46s 7,788 248 0
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 5.3 7.2 44.4% 1 534ms 784 46 0
Qwen3.6 35B A3B 3.5 4.4 33.3% 2 7.45s 781 11,381 0
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 4.8 10.0 0.0% 0 628ms 495 159 0
Qwen3.6 35B A3B 4.4 3.0 33.3% 1 3.51s 520 1,545 0
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 6.5 10.0 50.0% 0 551ms 691 82 0
Qwen3.6 35B A3B 6.2 5.8 66.7% 1 1.86s 709 1,264 0
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 3.1 10.0 0.0% 0 535ms 694 251 0
Qwen3.6 35B A3B 3.2 9.9 0.0% 0 1.07s 714 573 0
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 10.0 10.0 100.0% 0 1.27s 6,193 197 0
Qwen3.6 35B A3B 3.0 10.0 0.0% 0 0ms 0 0 0
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 3.0 10.0 0.0% 0 548ms 213 19 0
Qwen3.6 35B A3B 3.0 10.0 0.0% 0 414ms 210 12 0

দ্রুত তুলনা

তুলনার জুটি বদলান