নেভিগেশন
AI BENCHY
Advertise here

AI BENCHY Compare

Anthropic: Claude Opus 4.6 vs StepFun: Step 3.7 Flash

সারাংশ

Claude Opus 4.6 vs Step 3.7 Flash benchmark তুলনা: Step 3.7 Flash average score-এ এগিয়ে: 7.3 vs 7.0. Step 3.7 Flash-এর benchmark খরচ কম: $0.341 vs $2.053. Step 3.7 Flash দ্রুত: 15.74s vs 25.89s, pass rates 61.9% vs 68.3%.

প্রস্তাবিত মডেল: Step 3.7 Flash - It has the best score here (7.3), while costing about 6.0x less than Claude Opus 4.6.

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-06-04

মেট্রিক Claude Opus 4.6 Claude Opus 4.6 medium প্রকাশ: 2026-02-05 Step 3.7 Flash Step 3.7 Flash low প্রকাশ: 2026-05-29
স্কোর 7.0 7.3
র‍্যাঙ্ক #69 #57
নির্ভরযোগ্যতা 10.0 10.0
ধারাবাহিকতা 8.8 8.4
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 61.9% 68.3%
অস্থির টেস্ট 3 4
মোট রান 63 63
প্রতি ফলাফলে খরচ 17.103 2.840
মোট খরচ $2.053 $0.341
ইনপুট মূল্য $5.000 / 1M $0.200 / 1M
আউটপুট মূল্য $25.000 / 1M $1.150 / 1M
মোট ইনপুট টোকেন 53,227 40,101
আউটপুট টোকেন 47,446 289,325
রিজনিং টোকেন 24,000 0
প্রতিক্রিয়া সময় (গড়) 25.89s 15.74s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 83.40s 124.75s
প্রতিক্রিয়া সময় (মোট) 362.49s 330.63s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#69 Claude Opus 4.6

medium
Invalid SVG
Cost
$0.000
Time
300.0s
Tokens
0 tok

#57 Step 3.7 Flash

low
Invalid SVG
Cost
$0.004
Time
25.3s
Tokens
3,072 tok

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.6 6.4 5.8 66.7% 2 7.45s 840 986 1,071
Step 3.7 Flash 8.7 7.9 91.7% 1 4.02s 756 10,896 0
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.6 5.7 7.1 44.4% 1 30.10s 8,522 13,057 4,121
Step 3.7 Flash 8.2 7.2 88.9% 1 9.46s 7,437 18,685 0
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.6 10.0 10.0 100.0% 0 76.66s 20,685 8,178 5,194
Step 3.7 Flash 10.0 10.0 100.0% 0 7.98s 13,683 6,426 0
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.6 10.0 10.0 100.0% 0 7.37s 8,676 691 757
Step 3.7 Flash 7.3 5.8 83.3% 1 2.29s 7,398 2,667 0
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.6 3.0 10.0 0.0% 0 83.40s 674 14,642 8,687
Step 3.7 Flash 5.3 7.2 44.4% 1 43.31s 828 104,487 0
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.6 10.0 10.0 100.0% 0 5.04s 564 188 292
Step 3.7 Flash 3.4 9.3 0.0% 0 7.00s 525 4,604 0
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.6 10.0 10.0 100.0% 0 2.43s 792 266 467
Step 3.7 Flash 9.8 10.0 100.0% 0 1.58s 735 1,857 0
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.6 7.7 10.0 66.7% 0 4.71s 816 532 630
Step 3.7 Flash 5.5 9.9 33.3% 0 1.84s 756 3,564 0
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.6 10.0 10.0 100.0% 0 9.73s 11,454 861 329
Step 3.7 Flash 10.0 10.0 100.0% 0 3.25s 7,746 1,360 0
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
Claude Opus 4.6 3.0 10.0 0.0% 0 63.24s 204 8,045 2,452
Step 3.7 Flash 3.0 10.0 0.0% 0 124.75s 237 134,779 0

দ্রুত তুলনা

তুলনার জুটি বদলান