নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Anthropic: Claude Opus 4.8 vs OpenAI: GPT-5.4 Mini

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-05-28

মেট্রিক Claude Opus 4.8 Claude Opus 4.8 none প্রকাশ: 2026-05-28 GPT-5.4 Mini GPT-5.4 Mini medium প্রকাশ: 2026-03-17
স্কোর 7.3 7.3
র‍্যাঙ্ক #63 #62
নির্ভরযোগ্যতা 10.0 10.0
ধারাবাহিকতা 9.2 7.9
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 65.0% 71.7%
অস্থির টেস্ট 2 5
মোট রান 60 60
প্রতি ফলাফলে খরচ 4.324 4.417
মোট খরচ $0.519 $0.486
ইনপুট মূল্য $5.000 / 1M $0.750 / 1M
আউটপুট মূল্য $25.000 / 1M $4.500 / 1M
আউটপুট টোকেন 8,098 2,160
রিজনিং টোকেন 0 100,548
প্রতিক্রিয়া সময় (গড়) 3.51s 22.10s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 17.73s 138.75s
প্রতিক্রিয়া সময় (মোট) 70.19s 442.09s

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 6.5 10.0 50.0% 0 3.40s 1,472 0
GPT-5.4 Mini 8.6 7.9 91.7% 1 4.05s 296 2,876
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 6.8 10.0 50.0% 0 3.59s 1,323 0
GPT-5.4 Mini 7.5 6.0 83.3% 1 73.25s 446 32,513
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 9.5 10.0 100.0% 0 17.73s 3,259 0
GPT-5.4 Mini 10.0 10.0 100.0% 0 17.81s 317 4,317
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 7.3 5.8 83.3% 1 1.77s 308 0
GPT-5.4 Mini 10.0 10.0 100.0% 0 2.43s 234 650
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 5.3 7.2 44.4% 1 1.66s 61 0
GPT-5.4 Mini 4.1 4.4 44.5% 2 65.31s 60 43,286
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 10.0 10.0 100.0% 0 3.48s 230 0
GPT-5.4 Mini 4.5 10.0 0.0% 0 3.72s 150 510
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 9.9 10.0 100.0% 0 1.37s 95 0
GPT-5.4 Mini 9.8 10.0 100.0% 0 2.13s 96 1,185
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 7.7 10.0 66.7% 0 2.74s 783 0
GPT-5.4 Mini 7.8 10.0 66.7% 0 4.37s 278 2,443
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 10.0 10.0 100.0% 0 5.35s 355 0
GPT-5.4 Mini 4.7 1.6 66.7% 1 9.62s 251 2,594
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 3.0 10.0 0.0% 0 3.41s 212 0
GPT-5.4 Mini 3.0 10.0 0.0% 0 30.10s 32 10,174

দ্রুত তুলনা

তুলনার জুটি বদলান