নেভিগেশন
AI BENCHY
Your ad here

AI BENCHY Compare

Inception: Mercury 2 vs OpenAI: gpt-oss-120b

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-04-16

মেট্রিক Mercury 2 Mercury 2 none প্রকাশ: 2026-02-24 gpt-oss-120b gpt-oss-120b none প্রকাশ: 2025-08-05 বিনামূল্যে উপলভ্য
স্কোর 4.8 5.2
র‍্যাঙ্ক #89 #82
ধারাবাহিকতা 9.0 7.9
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 27.8% 38.9%
অস্থির টেস্ট 2 5
মোট রান 54 54
প্রতি ফলাফলে খরচ 0.165 0.221
মোট খরচ $0.007 $0.009
???? ??? $0.250 / 1M $0.039 / 1M
????? ??? $0.750 / 1M $0.190 / 1M
আউটপুট টোকেন 1,625 44,652
রিজনিং টোকেন 0 0
প্রতিক্রিয়া সময় (গড়) 613ms 11.96s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 1.27s 68.97s
প্রতিক্রিয়া সময় (মোট) 11.04s 179.34s

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 3.0 10.0 0.0% 0 483ms 286 0
gpt-oss-120b 6.6 8.0 58.3% 1 6.03s 4,867 0
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 3.6 8.9 0.0% 0 969ms 310 0
gpt-oss-120b 4.3 1.1 66.7% 1 9.57s 3,232 0
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 3.0 10.0 0.0% 0 606ms 131 0
gpt-oss-120b 3.0 10.0 0.0% 0 0ms 0 0
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 7.3 5.9 83.3% 1 667ms 180 0
gpt-oss-120b 6.5 10.0 50.0% 0 7.12s 598 0
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 5.3 7.2 44.4% 1 534ms 46 0
gpt-oss-120b 3.0 10.0 0.0% 0 34.98s 29,483 0
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 4.8 10.0 0.0% 0 628ms 159 0
gpt-oss-120b 4.6 10.0 0.0% 0 2.83s 586 0
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 6.5 10.0 50.0% 0 551ms 82 0
gpt-oss-120b 8.4 6.9 83.3% 1 5.10s 1,982 0
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 3.1 10.0 0.0% 0 533ms 234 0
gpt-oss-120b 4.5 4.8 44.5% 2 6.86s 3,904 0
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 10.0 10.0 100.0% 0 1.27s 197 0
gpt-oss-120b 3.0 10.0 0.0% 0 0ms 0 0

দ্রুত তুলনা

তুলনার জুটি বদলান