নেভিগেশন
AI BENCHY
Advertise here

AI BENCHY Compare

Inception: Mercury 2 vs inclusionAI: Ring-2.6-1T

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-06-03

মেট্রিক Mercury 2 Mercury 2 medium প্রকাশ: 2026-02-24 Ring-2.6-1T Ring-2.6-1T none প্রকাশ: 2026-05-10
স্কোর 6.5 6.4
র‍্যাঙ্ক #89 #93
নির্ভরযোগ্যতা 10.0 10.0
ধারাবাহিকতা 8.8 9.3
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 51.7% 50.0%
অস্থির টেস্ট 3 2
মোট রান 60 60
প্রতি ফলাফলে খরচ 0.611 0.000
মোট খরচ $0.055 $0.026
ইনপুট মূল্য $0.250 / 1M $0.075 / 1M
আউটপুট মূল্য $0.750 / 1M $0.625 / 1M
মোট ইনপুট টোকেন 32,570 7,599
আউটপুট টোকেন 4,022 39,954
রিজনিং টোকেন 58,405 0
প্রতিক্রিয়া সময় (গড়) 2.27s 55.10s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 14.63s 143.82s
প্রতিক্রিয়া সময় (মোট) 43.20s 881.55s

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 6.9 9.9 50.0% 0 1.12s 554 2,546 2,609
Ring-2.6-1T 9.2 8.4 91.7% 1 43.33s 810 5,575 0
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 7.2 6.5 66.7% 1 2.29s 4,519 270 8,514
Ring-2.6-1T 6.5 10.0 50.0% 0 143.82s 834 5,036 0
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 10.0 10.0 100.0% 0 3.28s 12,909 268 4,887
Ring-2.6-1T 3.0 10.0 0.0% 0 0ms 0 0 0
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 7.3 5.9 83.3% 1 1.11s 6,234 183 1,656
Ring-2.6-1T 3.0 10.0 0.0% 0 45.87s 2,712 1,529 0
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 2.9 7.2 11.1% 1 6.48s 695 41 30,754
Ring-2.6-1T 5.3 7.2 44.4% 1 73.40s 873 17,728 0
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 4.8 10.0 0.0% 0 821ms 456 137 542
Ring-2.6-1T 4.3 10.0 0.0% 0 15.63s 561 846 0
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 10.0 10.0 100.0% 0 1.07s 340 14 958
Ring-2.6-1T 9.8 10.0 100.0% 0 27.36s 774 2,004 0
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 5.4 10.0 33.3% 0 949ms 601 361 2,781
Ring-2.6-1T 7.7 10.0 66.7% 0 31.47s 792 3,469 0
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 10.0 10.0 100.0% 0 1.89s 6,080 180 1,956
Ring-2.6-1T 3.0 10.0 0.0% 0 0ms 0 0 0
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 3.0 10.0 0.0% 0 2.58s 182 22 3,748
Ring-2.6-1T 3.0 10.0 0.0% 0 133.60s 243 3,767 0

দ্রুত তুলনা

তুলনার জুটি বদলান