নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Anthropic: Claude Opus 4.6 vs StepFun: Step 3.7 Flash

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-05-29

মেট্রিক Claude Opus 4.6 Claude Opus 4.6 medium প্রকাশ: 2026-02-05 Step 3.7 Flash Step 3.7 Flash high প্রকাশ: 2026-05-29
স্কোর 7.2 7.1
র‍্যাঙ্ক #71 #74
নির্ভরযোগ্যতা 10.0 10.0
ধারাবাহিকতা 9.1 8.2
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 63.3% 65.8%
অস্থির টেস্ট 2 4
মোট রান 60 60
প্রতি ফলাফলে খরচ 15.796 8.723
মোট খরচ $1.896 $0.960
ইনপুট মূল্য $5.000 / 1M $0.200 / 1M
আউটপুট মূল্য $25.000 / 1M $1.150 / 1M
আউটপুট টোকেন 42,254 828,084
রিজনিং টোকেন 23,554 0
প্রতিক্রিয়া সময় (গড়) 25.45s 49.43s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 83.40s 192.75s
প্রতিক্রিয়া সময় (মোট) 330.91s 988.58s

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.6 6.4 5.8 66.7% 2 7.45s 986 1,071
Step 3.7 Flash 10.0 10.0 100.0% 0 13.40s 42,656 0
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.6 7.2 9.8 50.0% 0 29.37s 7,865 3,675
Step 3.7 Flash 3.6 4.6 25.0% 1 126.82s 164,069 0
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.6 10.0 10.0 100.0% 0 76.66s 8,178 5,194
Step 3.7 Flash 10.0 10.0 100.0% 0 13.01s 8,802 0
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.6 10.0 10.0 100.0% 0 7.37s 691 757
Step 3.7 Flash 10.0 10.0 100.0% 0 14.72s 23,113 0
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.6 3.0 10.0 0.0% 0 83.40s 14,642 8,687
Step 3.7 Flash 4.1 4.4 44.5% 2 149.64s 410,502 0
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.6 10.0 10.0 100.0% 0 5.04s 188 292
Step 3.7 Flash 5.5 10.0 0.0% 0 4.17s 2,862 0
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.6 10.0 10.0 100.0% 0 2.43s 266 467
Step 3.7 Flash 9.8 10.0 100.0% 0 1.52s 2,010 0
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.6 7.7 10.0 66.7% 0 4.71s 532 630
Step 3.7 Flash 5.3 7.2 44.4% 1 10.22s 25,422 0
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.6 10.0 10.0 100.0% 0 9.73s 861 329
Step 3.7 Flash 10.0 10.0 100.0% 0 2.79s 1,172 0
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.6 3.0 10.0 0.0% 0 63.24s 8,045 2,452
Step 3.7 Flash 3.0 10.0 0.0% 0 149.34s 147,476 0

দ্রুত তুলনা

তুলনার জুটি বদলান