নেভিগেশন
AI BENCHY
Advertise here

AI BENCHY Compare

Inception: Mercury 2 vs OpenAI: GPT-5.4

সারাংশ

Mercury 2 vs GPT-5.4 benchmark তুলনা: GPT-5.4 average score-এ এগিয়ে: 5.8 vs 4.6. Mercury 2-এর benchmark খরচ কম: $0.011 vs $0.122. Mercury 2 দ্রুত: 653ms vs 1.42s, pass rates 23.8% vs 36.5%.

প্রস্তাবিত মডেল: Mercury 2 - It offers the best overall trade-off: a competitive score (4.6), lower cost than GPT-5.4, and balanced response time.

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-06-18

মেট্রিক Mercury 2 Mercury 2 none প্রকাশ: 2026-02-24 GPT-5.4 GPT-5.4 none প্রকাশ: 2026-03-05
স্কোর 4.6 5.8
র‍্যাঙ্ক #151 #112
নির্ভরযোগ্যতা 10.0 10.0
ধারাবাহিকতা 9.2 9.2
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 23.8% 36.5%
অস্থির টেস্ট 2 2
মোট রান 63 63
প্রতি ফলাফলে খরচ 0.259 1.740
মোট খরচ $0.011 $0.122
ইনপুট মূল্য $0.250 / 1M $2.500 / 1M
আউটপুট মূল্য $0.750 / 1M $15.000 / 1M
মোট ইনপুট টোকেন 28,113 34,212
আউটপুট টোকেন 4,439 2,417
রিজনিং টোকেন 0 0
প্রতিক্রিয়া সময় (গড়) 653ms 1.42s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 1.43s 2.95s
প্রতিক্রিয়া সময় (মোট) 13.72s 29.87s

জেনারেশন শোকেস

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#151 Mercury 2

none
খরচ
$0.002
সময়
1.8s
টোকেন
1,514 tok

#112 GPT-5.4

none
খরচ
$0.026
সময়
18.1s
টোকেন
1,792 tok

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 3.0 10.0 0.0% 0 483ms 631 286 0
GPT-5.4 3.2 8.0 8.3% 1 1.21s 606 406 0
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 3.4 9.6 0.0% 0 1.03s 7,229 3,088 0
GPT-5.4 5.5 10.0 33.3% 0 1.62s 7,305 516 0
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 3.0 10.0 0.0% 0 606ms 4,821 131 0
GPT-5.4 3.0 10.0 0.0% 0 2.89s 11,019 291 0
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 7.3 5.9 83.3% 1 667ms 6,362 180 0
GPT-5.4 10.0 10.0 100.0% 0 1.04s 7,140 222 0
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 5.3 7.2 44.4% 1 534ms 784 46 0
GPT-5.4 5.3 7.2 44.4% 1 1.07s 723 50 0
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 4.8 10.0 0.0% 0 628ms 495 159 0
GPT-5.4 4.4 9.9 0.0% 0 1.78s 477 184 0
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 6.5 10.0 50.0% 0 551ms 691 82 0
GPT-5.4 6.5 10.0 50.0% 0 1.07s 660 81 0
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 3.1 10.0 0.0% 0 535ms 694 251 0
GPT-5.4 5.6 9.8 33.3% 0 1.44s 642 381 0
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 10.0 10.0 100.0% 0 1.27s 6,193 197 0
GPT-5.4 10.0 10.0 100.0% 0 2.75s 5,445 246 0
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Mercury 2 3.0 10.0 0.0% 0 548ms 213 19 0
GPT-5.4 3.0 10.0 0.0% 0 990ms 195 40 0

দ্রুত তুলনা

তুলনার জুটি বদলান