নেভিগেশন
AI BENCHY
Your ad here

AI BENCHY Compare

Inception: Mercury 2 vs Qwen: Qwen3.5-9B

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-04-26

মেট্রিক Mercury 2 Mercury 2 none প্রকাশ: 2026-02-24 Qwen3.5-9B Qwen3.5-9B medium প্রকাশ: 2026-03-02
স্কোর 4.8 4.4
র‍্যাঙ্ক #106 #114
নির্ভরযোগ্যতা প্রযোজ্য নয় প্রযোজ্য নয়
ধারাবাহিকতা 9.0 7.2
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 27.8% 33.3%
অস্থির টেস্ট 2 6
মোট রান 54 54
প্রতি ফলাফলে খরচ 0.165 0.976
মোট খরচ $0.007 $0.030
???? ??? $0.250 / 1M $0.100 / 1M
????? ??? $0.750 / 1M $0.150 / 1M
আউটপুট টোকেন 1,625 24,291
রিজনিং টোকেন 0 172,597
প্রতিক্রিয়া সময় (গড়) 613ms 73.64s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 1.27s 226.38s
প্রতিক্রিয়া সময় (মোট) 11.04s 1104.60s

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 3.0 10.0 0.0% 0 483ms 286 0
Qwen3.5-9B 5.1 5.8 50.0% 2 34.44s 2,621 12,411
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 3.6 8.9 0.0% 0 969ms 310 0
Qwen3.5-9B 2.6 10.0 0.0% 0 135.61s 6,150 31,393
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 3.0 10.0 0.0% 0 606ms 131 0
Qwen3.5-9B 3.0 10.0 0.0% 0 0ms 0 0
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 7.3 5.9 83.3% 1 667ms 180 0
Qwen3.5-9B 3.6 5.6 33.3% 1 87.31s 1,383 32,113
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 5.3 7.2 44.4% 1 534ms 46 0
Qwen3.5-9B 3.6 7.2 22.2% 1 137.75s 11,549 48,475
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 4.8 10.0 0.0% 0 628ms 159 0
Qwen3.5-9B 2.8 1.6 33.3% 1 226.38s 0 30,695
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 6.5 10.0 50.0% 0 551ms 82 0
Qwen3.5-9B 6.4 5.8 66.7% 1 17.15s 599 4,517
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 3.1 10.0 0.0% 0 533ms 234 0
Qwen3.5-9B 3.1 10.0 0.0% 0 33.38s 1,545 11,844
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 10.0 10.0 100.0% 0 1.27s 197 0
Qwen3.5-9B 10.0 10.0 100.0% 0 4.31s 444 1,149

দ্রুত তুলনা

তুলনার জুটি বদলান