نیویگیشن
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: GPT-5.4 Nano vs StepFun: Step 3.7 Flash

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-06-01

میٹرک GPT-5.4 Nano GPT-5.4 Nano medium اجرا: 2026-03-17 Step 3.7 Flash Step 3.7 Flash low اجرا: 2026-05-29
اسکور 7.2 7.4
درجہ #72 #59
اعتماد پذیری 10.0 10.0
تسلسل 8.8 8.7
درست ٹیسٹس
فی کوشش کامیابی کی شرح 63.3% 68.3%
غیر مستحکم ٹیسٹ 3 3
کل رنز 60 60
فی نتیجہ لاگت 0.900 2.796
کل لاگت $0.099 $0.336
ان پٹ قیمت $0.200 / 1M $0.200 / 1M
آؤٹ پٹ قیمت $1.250 / 1M $1.150 / 1M
آؤٹ پٹ ٹوکنز 2,993 285,209
ریزننگ ٹوکنز 70,928 0
ردِعمل کا وقت (اوسط) 11.79s 16.06s
ردِعمل کا وقت (زیادہ سے زیادہ) 94.06s 124.75s
ردِعمل کا وقت (کل) 235.81s 321.11s

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 Nano 8.3 10.0 75.0% 0 4.52s 683 2,254
Step 3.7 Flash 8.7 7.9 91.7% 1 4.02s 10,896 0
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 Nano 6.8 6.2 66.7% 1 21.10s 495 15,186
Step 3.7 Flash 10.0 10.0 100.0% 0 9.43s 14,569 0
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 Nano 9.8 10.0 100.0% 0 24.13s 349 5,719
Step 3.7 Flash 10.0 10.0 100.0% 0 7.98s 6,426 0
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 Nano 10.0 10.0 100.0% 0 2.54s 234 516
Step 3.7 Flash 7.3 5.8 83.3% 1 2.29s 2,667 0
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 Nano 5.9 7.2 55.6% 1 38.18s 60 43,325
Step 3.7 Flash 5.3 7.2 44.4% 1 43.31s 104,487 0
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 Nano 4.5 10.0 0.0% 0 4.15s 179 443
Step 3.7 Flash 3.4 9.3 0.0% 0 7.00s 4,604 0
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 Nano 9.8 10.0 100.0% 0 1.88s 95 521
Step 3.7 Flash 9.8 10.0 100.0% 0 1.58s 1,857 0
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 Nano 4.1 7.2 22.2% 1 3.79s 594 1,408
Step 3.7 Flash 5.5 9.9 33.3% 0 1.84s 3,564 0
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 Nano 10.0 10.0 100.0% 0 7.71s 234 382
Step 3.7 Flash 10.0 10.0 100.0% 0 3.25s 1,360 0
معلومات عامہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 Nano 3.0 10.0 0.0% 0 4.81s 70 1,174
Step 3.7 Flash 3.0 10.0 0.0% 0 124.75s 134,779 0

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں