নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

DeepSeek: DeepSeek V4 Pro vs Inception: Mercury 2

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-04-24

মেট্রিক DeepSeek V4 Pro DeepSeek V4 Pro high প্রকাশ: 2026-04-24 Mercury 2 Mercury 2 medium প্রকাশ: 2026-02-24
স্কোর 7.4 6.5
র‍্যাঙ্ক #50 #62
ধারাবাহিকতা 10.0 8.6
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 61.1% 53.7%
অস্থির টেস্ট 0 3
মোট রান 24 54
প্রতি ফলাফলে খরচ 1.385 0.580
মোট খরচ $0.153 $0.047
???? ??? $1.740 / 1M $0.250 / 1M
????? ??? $3.480 / 1M $0.750 / 1M
আউটপুট টোকেন 584 3,972
রিজনিং টোকেন 37,708 48,333
প্রতিক্রিয়া সময় (গড়) 78.45s 2.21s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 351.99s 14.63s
প্রতিক্রিয়া সময় (মোট) 1255.22s 37.51s

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
DeepSeek V4 Pro 8.3 10.0 75.0% 0 32.12s 64 1,799
Mercury 2 6.9 9.9 50.0% 0 1.12s 2,546 2,609
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
DeepSeek V4 Pro 10.0 10.0 100.0% 0 93.00s 82 2,808
Mercury 2 10.0 10.0 100.0% 0 1.53s 249 2,213
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
DeepSeek V4 Pro 10.0 10.0 100.0% 0 71.08s 134 2,163
Mercury 2 10.0 10.0 100.0% 0 3.28s 268 4,887
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
DeepSeek V4 Pro 10.0 10.0 100.0% 0 63.00s 67 1,071
Mercury 2 7.3 5.9 83.3% 1 1.11s 183 1,656
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
DeepSeek V4 Pro 5.3 10.0 33.3% 0 202.56s 11 25,343
Mercury 2 2.9 7.2 11.1% 1 6.48s 41 30,754
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
DeepSeek V4 Pro 5.0 10.0 0.0% 0 26.96s 51 734
Mercury 2 4.8 10.0 0.0% 0 821ms 137 542
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
DeepSeek V4 Pro 3.0 10.0 0.0% 0 0ms 0 0
Mercury 2 10.0 10.0 100.0% 0 1.07s 14 958
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
DeepSeek V4 Pro 7.7 10.0 66.7% 0 63.66s 91 3,617
Mercury 2 3.9 7.5 22.2% 1 934ms 354 2,758
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
DeepSeek V4 Pro 10.0 10.0 100.0% 0 11.05s 84 173
Mercury 2 10.0 10.0 100.0% 0 1.89s 180 1,956

দ্রুত তুলনা

তুলনার জুটি বদলান