نیویگیشن
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: GPT-5.4 Nano vs StepFun: Step 3.7 Flash

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-05-29

میٹرک GPT-5.4 Nano GPT-5.4 Nano medium اجرا: 2026-03-17 Step 3.7 Flash Step 3.7 Flash high اجرا: 2026-05-29
اسکور 7.2 7.1
درجہ #72 #74
اعتماد پذیری 10.0 10.0
تسلسل 8.8 8.2
درست ٹیسٹس
فی کوشش کامیابی کی شرح 63.3% 65.8%
غیر مستحکم ٹیسٹ 3 4
کل رنز 60 60
فی نتیجہ لاگت 0.900 8.723
کل لاگت $0.099 $0.960
ان پٹ قیمت $0.200 / 1M $0.200 / 1M
آؤٹ پٹ قیمت $1.250 / 1M $1.150 / 1M
آؤٹ پٹ ٹوکنز 2,993 828,084
ریزننگ ٹوکنز 70,928 0
ردِعمل کا وقت (اوسط) 11.79s 49.43s
ردِعمل کا وقت (زیادہ سے زیادہ) 94.06s 192.75s
ردِعمل کا وقت (کل) 235.81s 988.58s

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 Nano 8.3 10.0 75.0% 0 4.52s 683 2,254
Step 3.7 Flash 10.0 10.0 100.0% 0 13.40s 42,656 0
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 Nano 6.8 6.2 66.7% 1 21.10s 495 15,186
Step 3.7 Flash 3.6 4.6 25.0% 1 126.82s 164,069 0
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 Nano 9.8 10.0 100.0% 0 24.13s 349 5,719
Step 3.7 Flash 10.0 10.0 100.0% 0 13.01s 8,802 0
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 Nano 10.0 10.0 100.0% 0 2.54s 234 516
Step 3.7 Flash 10.0 10.0 100.0% 0 14.72s 23,113 0
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 Nano 5.9 7.2 55.6% 1 38.18s 60 43,325
Step 3.7 Flash 4.1 4.4 44.5% 2 149.64s 410,502 0
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 Nano 4.5 10.0 0.0% 0 4.15s 179 443
Step 3.7 Flash 5.5 10.0 0.0% 0 4.17s 2,862 0
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 Nano 9.8 10.0 100.0% 0 1.88s 95 521
Step 3.7 Flash 9.8 10.0 100.0% 0 1.52s 2,010 0
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 Nano 4.1 7.2 22.2% 1 3.79s 594 1,408
Step 3.7 Flash 5.3 7.2 44.4% 1 10.22s 25,422 0
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 Nano 10.0 10.0 100.0% 0 7.71s 234 382
Step 3.7 Flash 10.0 10.0 100.0% 0 2.79s 1,172 0
معلومات عامہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.4 Nano 3.0 10.0 0.0% 0 4.81s 70 1,174
Step 3.7 Flash 3.0 10.0 0.0% 0 149.34s 147,476 0

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں