নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Anthropic: Claude Opus 4.8 vs StepFun: Step 3.7 Flash

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-05-29

মেট্রিক Claude Opus 4.8 Claude Opus 4.8 none প্রকাশ: 2026-05-28 Step 3.7 Flash Step 3.7 Flash low প্রকাশ: 2026-05-29
স্কোর 7.3 7.4
র‍্যাঙ্ক #65 #60
নির্ভরযোগ্যতা 10.0 10.0
ধারাবাহিকতা 9.2 8.7
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 65.0% 68.3%
অস্থির টেস্ট 2 3
মোট রান 60 60
প্রতি ফলাফলে খরচ 4.324 2.796
মোট খরচ $0.519 $0.336
ইনপুট মূল্য $5.000 / 1M $0.200 / 1M
আউটপুট মূল্য $25.000 / 1M $1.150 / 1M
আউটপুট টোকেন 8,098 285,209
রিজনিং টোকেন 0 0
প্রতিক্রিয়া সময় (গড়) 3.51s 16.06s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 17.73s 124.75s
প্রতিক্রিয়া সময় (মোট) 70.19s 321.11s

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 6.5 10.0 50.0% 0 3.40s 1,472 0
Step 3.7 Flash 8.7 7.9 91.7% 1 4.02s 10,896 0
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 6.8 10.0 50.0% 0 3.59s 1,323 0
Step 3.7 Flash 10.0 10.0 100.0% 0 9.43s 14,569 0
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 9.5 10.0 100.0% 0 17.73s 3,259 0
Step 3.7 Flash 10.0 10.0 100.0% 0 7.98s 6,426 0
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 7.3 5.8 83.3% 1 1.77s 308 0
Step 3.7 Flash 7.3 5.8 83.3% 1 2.29s 2,667 0
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 5.3 7.2 44.4% 1 1.66s 61 0
Step 3.7 Flash 5.3 7.2 44.4% 1 43.31s 104,487 0
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 10.0 10.0 100.0% 0 3.48s 230 0
Step 3.7 Flash 3.4 9.3 0.0% 0 7.00s 4,604 0
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 9.9 10.0 100.0% 0 1.37s 95 0
Step 3.7 Flash 9.8 10.0 100.0% 0 1.58s 1,857 0
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 7.7 10.0 66.7% 0 2.74s 783 0
Step 3.7 Flash 5.5 9.9 33.3% 0 1.84s 3,564 0
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 10.0 10.0 100.0% 0 5.35s 355 0
Step 3.7 Flash 10.0 10.0 100.0% 0 3.25s 1,360 0
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 3.0 10.0 0.0% 0 3.41s 212 0
Step 3.7 Flash 3.0 10.0 0.0% 0 124.75s 134,779 0

দ্রুত তুলনা

তুলনার জুটি বদলান