نیویگیشن
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

DeepSeek: DeepSeek V4 Flash vs StepFun: Step 3.5 Flash

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-04-24

میٹرک DeepSeek V4 Flash DeepSeek V4 Flash high اجرا: 2026-04-24 Step 3.5 Flash Step 3.5 Flash medium اجرا: 2026-02-01
اسکور 7.8 7.9
درجہ #35 #34
تسلسل 7.8 9.1
درست ٹیسٹس
فی کوشش کامیابی کی شرح 79.6% 70.6%
غیر مستحکم ٹیسٹ 5 2
کل رنز 52 49
فی نتیجہ لاگت 0.189 0.000
کل لاگت $0.021 $0.000
?? ?? ???? $0.140 / 1M $0.100 / 1M
??? ?? ???? $0.280 / 1M $0.300 / 1M
آؤٹ پٹ ٹوکنز 1,757 71,904
ریزننگ ٹوکنز 55,907 155,607
ردِعمل کا وقت (اوسط) 47.47s 26.78s
ردِعمل کا وقت (زیادہ سے زیادہ) 255.28s 170.45s
ردِعمل کا وقت (کل) 854.45s 294.58s

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
DeepSeek V4 Flash 8.3 10.0 75.0% 0 28.51s 140 7,770
Step 3.5 Flash 10.0 10.0 100.0% 0 13.56s 14,376 17,668
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
DeepSeek V4 Flash 10.0 10.0 100.0% 0 62.48s 369 9,361
Step 3.5 Flash - - - - - - - -
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
DeepSeek V4 Flash 10.0 10.0 100.0% 0 76.57s 465 7,347
Step 3.5 Flash 10.0 10.0 100.0% 0 29.57s 1,176 12,984
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
DeepSeek V4 Flash 10.0 10.0 100.0% 0 28.03s 201 1,179
Step 3.5 Flash 10.0 10.0 100.0% 0 15.01s 600 13,886
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
DeepSeek V4 Flash 4.1 4.4 44.5% 2 112.69s 19 24,857
Step 3.5 Flash 5.3 7.2 44.4% 1 170.45s 45,350 90,436
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
DeepSeek V4 Flash 6.1 3.1 66.7% 1 25.15s 79 632
Step 3.5 Flash 5.5 10.0 0.0% 0 6.54s 2,214 2,584
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
DeepSeek V4 Flash 10.0 10.0 100.0% 0 15.36s 63 1,622
Step 3.5 Flash 8.5 6.8 83.3% 1 4.98s 2,284 3,412
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
DeepSeek V4 Flash 6.4 4.5 77.8% 2 25.53s 193 2,597
Step 3.5 Flash 5.3 10.0 33.3% 0 7.72s 5,629 10,835
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
DeepSeek V4 Flash 10.0 10.0 100.0% 0 74.73s 228 542
Step 3.5 Flash 10.0 10.0 100.0% 0 11.91s 275 3,802

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں