নেভিগেশন
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

DeepSeek: DeepSeek V3.2 vs StepFun: Step 3.7 Flash

AI BENCHY টেস্ট স্যুট থেকে বেঞ্চমার্ক তৈরি হয়েছে: 2026-05-29

মেট্রিক DeepSeek V3.2 DeepSeek V3.2 medium প্রকাশ: 2025-12-01 Step 3.7 Flash Step 3.7 Flash low প্রকাশ: 2026-05-29
স্কোর 7.3 7.4
র‍্যাঙ্ক #67 #60
নির্ভরযোগ্যতা 10.0 10.0
ধারাবাহিকতা 7.9 8.7
সঠিক টেস্ট
প্রতি চেষ্টায় পাস রেট 67.5% 68.3%
অস্থির টেস্ট 5 3
মোট রান 60 60
প্রতি ফলাফলে খরচ 0.335 2.796
মোট খরচ $0.037 $0.336
ইনপুট মূল্য $0.252 / 1M $0.200 / 1M
আউটপুট মূল্য $0.378 / 1M $1.150 / 1M
আউটপুট টোকেন 7,177 285,209
রিজনিং টোকেন 68,297 0
প্রতিক্রিয়া সময় (গড়) 53.34s 16.06s
প্রতিক্রিয়া সময় (সর্বোচ্চ) 189.03s 124.75s
প্রতিক্রিয়া সময় (মোট) 1066.71s 321.11s

স্কোর অনুযায়ী শীর্ষ মডেল

স্কোর বনাম মোট খরচ

প্রতিক্রিয়া সময় (গড়)

স্কোর vs প্রতিক্রিয়া সময় (গড়)

মোট আউটপুট টোকেন

স্কোর vs মোট আউটপুট টোকেন

বিভাগভিত্তিক বিশ্লেষণ

অ্যান্টি-এআই কৌশল স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
DeepSeek V3.2 10.0 10.0 100.0% 0 24.23s 3,247 6,953
Step 3.7 Flash 8.7 7.9 91.7% 1 4.02s 10,896 0
কোডিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
DeepSeek V3.2 4.1 5.8 33.3% 1 184.97s 640 21,230
Step 3.7 Flash 10.0 10.0 100.0% 0 9.43s 14,569 0
সমন্বিত স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
DeepSeek V3.2 10.0 10.0 100.0% 0 93.11s 571 6,296
Step 3.7 Flash 10.0 10.0 100.0% 0 7.98s 6,426 0
ডেটা পার্সিং ও নিষ্কাশন স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
DeepSeek V3.2 10.0 10.0 100.0% 0 36.09s 207 7,693
Step 3.7 Flash 7.3 5.8 83.3% 1 2.29s 2,667 0
ডোমেইন-নির্দিষ্ট স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
DeepSeek V3.2 2.9 4.4 22.2% 2 24.27s 21 6,838
Step 3.7 Flash 5.3 7.2 44.4% 1 43.31s 104,487 0
Sadharon Buddhimotta স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
DeepSeek V3.2 5.1 2.5 50.0% 1 58.29s 49 2,189
Step 3.7 Flash 3.4 9.3 0.0% 0 7.00s 4,604 0
নির্দেশনা অনুসরণ স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
DeepSeek V3.2 10.0 10.0 100.0% 0 35.78s 1,397 2,845
Step 3.7 Flash 9.8 10.0 100.0% 0 1.58s 1,857 0
ধাঁধা সমাধান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
DeepSeek V3.2 7.0 7.2 55.6% 1 37.69s 518 6,375
Step 3.7 Flash 5.5 9.9 33.3% 0 1.84s 3,564 0
টুল কলিং স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
DeepSeek V3.2 10.0 10.0 100.0% 0 34.81s 507 859
Step 3.7 Flash 10.0 10.0 100.0% 0 3.25s 1,360 0
সাধারণ জ্ঞান স্কোর ধারাবাহিকতা প্রতি চেষ্টায় পাস রেট অস্থির টেস্ট সঠিক টেস্ট প্রতিক্রিয়া সময় (গড়) আউটপুট টোকেন রিজনিং টোকেন
DeepSeek V3.2 3.0 10.0 0.0% 0 83.99s 20 7,019
Step 3.7 Flash 3.0 10.0 0.0% 0 124.75s 134,779 0

দ্রুত তুলনা

তুলনার জুটি বদলান