نیویگیشن
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

DeepSeek: DeepSeek V3.2 vs StepFun: Step 3.7 Flash

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-05-29

میٹرک DeepSeek V3.2 DeepSeek V3.2 medium اجرا: 2025-12-01 Step 3.7 Flash Step 3.7 Flash high اجرا: 2026-05-29
اسکور 7.3 7.1
درجہ #67 #74
اعتماد پذیری 10.0 10.0
تسلسل 7.9 8.2
درست ٹیسٹس
فی کوشش کامیابی کی شرح 67.5% 65.8%
غیر مستحکم ٹیسٹ 5 4
کل رنز 60 60
فی نتیجہ لاگت 0.335 8.723
کل لاگت $0.037 $0.960
ان پٹ قیمت $0.252 / 1M $0.200 / 1M
آؤٹ پٹ قیمت $0.378 / 1M $1.150 / 1M
آؤٹ پٹ ٹوکنز 7,177 828,084
ریزننگ ٹوکنز 68,297 0
ردِعمل کا وقت (اوسط) 53.34s 49.43s
ردِعمل کا وقت (زیادہ سے زیادہ) 189.03s 192.75s
ردِعمل کا وقت (کل) 1066.71s 988.58s

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
DeepSeek V3.2 10.0 10.0 100.0% 0 24.23s 3,247 6,953
Step 3.7 Flash 10.0 10.0 100.0% 0 13.40s 42,656 0
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
DeepSeek V3.2 4.1 5.8 33.3% 1 184.97s 640 21,230
Step 3.7 Flash 3.6 4.6 25.0% 1 126.82s 164,069 0
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
DeepSeek V3.2 10.0 10.0 100.0% 0 93.11s 571 6,296
Step 3.7 Flash 10.0 10.0 100.0% 0 13.01s 8,802 0
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
DeepSeek V3.2 10.0 10.0 100.0% 0 36.09s 207 7,693
Step 3.7 Flash 10.0 10.0 100.0% 0 14.72s 23,113 0
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
DeepSeek V3.2 2.9 4.4 22.2% 2 24.27s 21 6,838
Step 3.7 Flash 4.1 4.4 44.5% 2 149.64s 410,502 0
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
DeepSeek V3.2 5.1 2.5 50.0% 1 58.29s 49 2,189
Step 3.7 Flash 5.5 10.0 0.0% 0 4.17s 2,862 0
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
DeepSeek V3.2 10.0 10.0 100.0% 0 35.78s 1,397 2,845
Step 3.7 Flash 9.8 10.0 100.0% 0 1.52s 2,010 0
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
DeepSeek V3.2 7.0 7.2 55.6% 1 37.69s 518 6,375
Step 3.7 Flash 5.3 7.2 44.4% 1 10.22s 25,422 0
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
DeepSeek V3.2 10.0 10.0 100.0% 0 34.81s 507 859
Step 3.7 Flash 10.0 10.0 100.0% 0 2.79s 1,172 0
معلومات عامہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
DeepSeek V3.2 3.0 10.0 0.0% 0 83.99s 20 7,019
Step 3.7 Flash 3.0 10.0 0.0% 0 149.34s 147,476 0

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں