নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Anthropic: Claude Opus 4.8 vs StepFun: Step 3.5 Flash

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-05-28

মেট্রিক Claude Opus 4.8 Claude Opus 4.8 none প্রকাশ: 2026-05-28 Step 3.5 Flash Step 3.5 Flash medium প্রকাশ: 2026-02-01
স্কোর 7.3 7.4
র‍্যাঙ্ক #63 #59
নির্ভরযোগ্যতা 10.0 10.0
ধারাবাহিকতা 9.2 9.1
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 65.0% 62.3%
অস্থির টেস্ট 2 2
মোট রান 60 57
প্রতি ফলাফলে খরচ 4.324 0.133
মোট খরচ $0.519 $0.062
ইনপুট মূল্য $5.000 / 1M $0.090 / 1M
আউটপুট মূল্য $25.000 / 1M $0.300 / 1M
আউটপুট টোকেন 8,098 90,478
রিজনিং টোকেন 0 173,544
প্রতিক্রিয়া সময় (গড়) 3.51s 43.20s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 17.73s 170.45s
প্রতিক্রিয়া সময় (মোট) 70.19s 561.54s

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 6.5 10.0 50.0% 0 3.40s 1,472 0
Step 3.5 Flash 10.0 10.0 100.0% 0 40.57s 20,391 24,176
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 6.8 10.0 50.0% 0 3.59s 1,323 0
Step 3.5 Flash 3.0 6.0 50.0% 1 62.83s 12,098 0
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 9.5 10.0 100.0% 0 17.73s 3,259 0
Step 3.5 Flash 10.0 10.0 100.0% 0 29.57s 1,176 12,984
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 7.3 5.8 83.3% 1 1.77s 308 0
Step 3.5 Flash 10.0 10.0 100.0% 0 15.01s 600 13,886
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 5.3 7.2 44.4% 1 1.66s 61 0
Step 3.5 Flash 5.3 7.2 44.4% 1 170.45s 45,350 90,436
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 10.0 10.0 100.0% 0 3.48s 230 0
Step 3.5 Flash 5.5 10.0 0.0% 0 22.39s 240 3,506
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 9.9 10.0 100.0% 0 1.37s 95 0
Step 3.5 Flash 8.3 10.0 50.0% 0 4.78s 2,364 3,521
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 7.7 10.0 66.7% 0 2.74s 783 0
Step 3.5 Flash 5.3 10.0 33.3% 0 7.22s 5,630 10,861
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 10.0 10.0 100.0% 0 5.35s 355 0
Step 3.5 Flash 10.0 10.0 100.0% 0 11.91s 275 3,802
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.8 3.0 10.0 0.0% 0 3.41s 212 0
Step 3.5 Flash 3.0 10.0 0.0% 0 108.45s 2,354 10,372

দ্রুত তুলনা

তুলনার জুটি বদলান