নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Inception: Mercury 2 vs Elephant Alpha

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-06-03

মেট্রিক Mercury 2 Mercury 2 none প্রকাশ: 2026-02-24 Elephant Alpha Elephant Alpha medium প্রকাশ: 2026-04-14
স্কোর 4.6 5.3
র‍্যাঙ্ক #153 #134
নির্ভরযোগ্যতা 10.0 প্রযোজ্য নয়
ধারাবাহিকতা 9.1 9.7
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 25.0% 31.7%
অস্থির টেস্ট 2 1
মোট রান 60 60
প্রতি ফলাফলে খরচ 0.216 0.000
মোট খরচ $0.009 $0.000
ইনপুট মূল্য $0.250 / 1M $0.000 / 1M
আউটপুট মূল্য $0.750 / 1M $0.000 / 1M
মোট ইনপুট টোকেন 25,515 33,744
আউটপুট টোকেন 3,001 2,596
রিজনিং টোকেন 0 0
প্রতিক্রিয়া সময় (গড়) 614ms 1.27s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 1.27s 3.70s
প্রতিক্রিয়া সময় (মোট) 12.28s 22.82s

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 3.0 10.0 0.0% 0 483ms 631 286 0
Elephant Alpha 6.6 10.0 50.0% 0 1.19s 726 815 0
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 3.5 9.4 0.0% 0 831ms 4,631 1,650 0
Elephant Alpha 4.0 6.7 16.7% 1 1.30s 813 365 0
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 3.0 10.0 0.0% 0 606ms 4,821 131 0
Elephant Alpha 3.0 10.0 0.0% 0 3.70s 14,046 562 0
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 7.3 5.9 83.3% 1 667ms 6,362 180 0
Elephant Alpha 6.5 10.0 50.0% 0 979ms 8,004 246 0
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 5.3 7.2 44.4% 1 534ms 784 46 0
Elephant Alpha 3.0 10.0 0.0% 0 925ms 810 24 0
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 4.8 10.0 0.0% 0 628ms 495 159 0
Elephant Alpha 4.3 10.0 0.0% 0 920ms 540 105 0
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 6.5 10.0 50.0% 0 551ms 691 82 0
Elephant Alpha 9.8 10.0 100.0% 0 987ms 732 82 0
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 3.1 10.0 0.0% 0 535ms 694 251 0
Elephant Alpha 5.3 10.0 33.3% 0 868ms 729 166 0
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 10.0 10.0 100.0% 0 1.27s 6,193 197 0
Elephant Alpha 3.0 10.0 0.0% 0 2.83s 7,344 231 0
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 3.0 10.0 0.0% 0 548ms 213 19 0
Elephant Alpha 3.0 10.0 0.0% 0 0ms 0 0 0

দ্রুত তুলনা

তুলনার জুটি বদলান