নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Anthropic: Claude Sonnet 4.6 vs StepFun: Step 3.7 Flash

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-05-29

মেট্রিক Claude Sonnet 4.6 Claude Sonnet 4.6 medium প্রকাশ: 2026-02-17 Step 3.7 Flash Step 3.7 Flash low প্রকাশ: 2026-05-29
স্কোর 7.6 7.4
র‍্যাঙ্ক #53 #60
নির্ভরযোগ্যতা 10.0 10.0
ধারাবাহিকতা 9.2 8.7
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 68.3% 68.3%
অস্থির টেস্ট 2 3
মোট রান 60 60
প্রতি ফলাফলে খরচ 10.229 2.796
মোট খরচ $1.330 $0.336
ইনপুট মূল্য $3.000 / 1M $0.200 / 1M
আউটপুট মূল্য $15.000 / 1M $1.150 / 1M
আউটপুট টোকেন 49,891 285,209
রিজনিং টোকেন 29,565 0
প্রতিক্রিয়া সময় (গড়) 15.81s 16.06s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 46.35s 124.75s
প্রতিক্রিয়া সময় (মোট) 189.71s 321.11s

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 6.5 10.0 50.0% 0 2.98s 1,046 1,093
Step 3.7 Flash 8.7 7.9 91.7% 1 4.02s 10,896 0
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 6.9 6.0 66.7% 1 33.87s 11,277 3,281
Step 3.7 Flash 10.0 10.0 100.0% 0 9.43s 14,569 0
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 10.0 10.0 100.0% 0 46.35s 5,871 3,962
Step 3.7 Flash 10.0 10.0 100.0% 0 7.98s 6,426 0
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 10.0 10.0 100.0% 0 13.90s 649 742
Step 3.7 Flash 7.3 5.8 83.3% 1 2.29s 2,667 0
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 2.9 7.2 11.1% 1 0ms 25,790 16,919
Step 3.7 Flash 5.3 7.2 44.4% 1 43.31s 104,487 0
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 10.0 10.0 100.0% 0 4.94s 256 433
Step 3.7 Flash 3.4 9.3 0.0% 0 7.00s 4,604 0
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 10.0 10.0 100.0% 0 2.61s 318 552
Step 3.7 Flash 9.8 10.0 100.0% 0 1.58s 1,857 0
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 10.0 10.0 100.0% 0 5.31s 592 646
Step 3.7 Flash 5.5 9.9 33.3% 0 1.84s 3,564 0
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 10.0 10.0 100.0% 0 7.48s 655 351
Step 3.7 Flash 10.0 10.0 100.0% 0 3.25s 1,360 0
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
Claude Sonnet 4.6 3.0 10.0 0.0% 0 30.09s 3,437 1,586
Step 3.7 Flash 3.0 10.0 0.0% 0 124.75s 134,779 0

দ্রুত তুলনা

তুলনার জুটি বদলান