নেভিগেশন
AI BENCHY
Advertise here

AI BENCHY Compare

DeepSeek: DeepSeek V4 Pro vs StepFun: Step 3.7 Flash

সারাংশ

DeepSeek V4 Pro vs Step 3.7 Flash benchmark তুলনা: Step 3.7 Flash average score-এ এগিয়ে: 8.5 vs 7.6. DeepSeek V4 Pro-এর benchmark খরচ কম: $0.157 vs $0.376. Step 3.7 Flash দ্রুত: 20.35s vs 77.20s, pass rates 66.7% vs 73.0%.

প্রস্তাবিত মডেল: Step 3.7 Flash - It has the best score here (8.5), while responding about 3.8x faster than DeepSeek V4 Pro.

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-06-18

মেট্রিক DeepSeek V4 Pro DeepSeek V4 Pro high প্রকাশ: 2026-04-24 Step 3.7 Flash Step 3.7 Flash medium প্রকাশ: 2026-05-29
স্কোর 7.6 8.5
র‍্যাঙ্ক #41 #20
নির্ভরযোগ্যতা 9.3 9.9
ধারাবাহিকতা 7.0 9.3
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 66.7% 73.0%
অস্থির টেস্ট 8 2
মোট রান 63 61
প্রতি ফলাফলে খরচ 1.742 2.686
মোট খরচ $0.157 $0.376
ইনপুট মূল্য $0.435 / 1M $0.200 / 1M
আউটপুট মূল্য $0.870 / 1M $1.150 / 1M
মোট ইনপুট টোকেন 38,726 39,981
আউটপুট টোকেন 6,334 319,958
রিজনিং টোকেন 159,151 0
প্রতিক্রিয়া সময় (গড়) 77.20s 20.35s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 416.76s 113.98s
প্রতিক্রিয়া সময় (মোট) 1621.17s 427.42s

জেনারেশন শোকেস

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#41 DeepSeek V4 Pro

high
খরচ
$0.023
সময়
257.6s
টোকেন
14,870 tok

#20 Step 3.7 Flash

medium
খরচ
$0.006
সময়
46.2s
টোকেন
4,466 tok

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
DeepSeek V4 Pro 5.7 5.9 58.3% 2 25.70s 536 149 3,214
Step 3.7 Flash 8.7 7.9 91.7% 1 9.65s 756 32,185 0
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
DeepSeek V4 Pro 6.1 4.6 66.7% 2 243.00s 5,090 383 84,580
Step 3.7 Flash 8.8 7.8 88.9% 1 27.42s 7,437 44,797 0
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
DeepSeek V4 Pro 10.0 10.0 100.0% 0 38.17s 14,060 454 5,836
Step 3.7 Flash 10.0 10.0 100.0% 0 9.06s 13,683 7,106 0
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
DeepSeek V4 Pro 10.0 10.0 100.0% 0 25.03s 7,690 274 2,166
Step 3.7 Flash 10.0 10.0 100.0% 0 2.75s 7,398 3,020 0
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
DeepSeek V4 Pro 3.6 7.2 22.2% 1 151.46s 569 4,404 50,391
Step 3.7 Flash 7.7 10.0 66.7% 0 48.27s 708 70,347 0
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
DeepSeek V4 Pro 10.0 10.0 100.0% 0 8.83s 471 115 1,013
Step 3.7 Flash 4.0 10.0 0.0% 0 6.85s 525 3,987 0
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
DeepSeek V4 Pro 7.8 6.6 83.3% 1 8.73s 627 66 2,726
Step 3.7 Flash 9.8 10.0 100.0% 0 1.83s 735 2,166 0
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
DeepSeek V4 Pro 6.9 4.9 77.8% 2 56.85s 591 178 2,563
Step 3.7 Flash 5.7 9.9 33.3% 0 6.19s 756 15,071 0
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
DeepSeek V4 Pro 9.8 10.0 100.0% 0 15.92s 8,909 295 701
Step 3.7 Flash 10.0 10.0 100.0% 0 4.16s 7,746 2,115 0
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) ইনপুট টোকেন আউটপুট টোকেন রিজনিং টোকেন
DeepSeek V4 Pro 3.0 10.0 0.0% 0 34.01s 183 16 5,961
Step 3.7 Flash 3.0 10.0 0.0% 0 113.98s 237 139,164 0

দ্রুত তুলনা

তুলনার জুটি বদলান