نیویگیشن
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: GPT-5.3 Chat vs StepFun: Step 3.7 Flash

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-05-29

میٹرک GPT-5.3 Chat GPT-5.3 Chat none اجرا: 2026-03-03 Step 3.7 Flash Step 3.7 Flash low اجرا: 2026-05-29
اسکور 7.4 7.4
درجہ #57 #60
اعتماد پذیری 10.0 10.0
تسلسل 8.4 8.7
درست ٹیسٹس
فی کوشش کامیابی کی شرح 68.3% 68.3%
غیر مستحکم ٹیسٹ 4 3
کل رنز 60 60
فی نتیجہ لاگت 3.350 2.796
کل لاگت $0.402 $0.336
ان پٹ قیمت $1.750 / 1M $0.200 / 1M
آؤٹ پٹ قیمت $14.000 / 1M $1.150 / 1M
آؤٹ پٹ ٹوکنز 24,757 285,209
ریزننگ ٹوکنز 0 0
ردِعمل کا وقت (اوسط) 6.13s 16.06s
ردِعمل کا وقت (زیادہ سے زیادہ) 18.33s 124.75s
ردِعمل کا وقت (کل) 122.61s 321.11s

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.3 Chat 6.7 8.1 58.3% 1 3.86s 3,167 0
Step 3.7 Flash 8.7 7.9 91.7% 1 4.02s 10,896 0
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.3 Chat 6.9 6.2 66.7% 1 10.52s 4,772 0
Step 3.7 Flash 10.0 10.0 100.0% 0 9.43s 14,569 0
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.3 Chat 10.0 10.0 100.0% 0 11.96s 2,614 0
Step 3.7 Flash 10.0 10.0 100.0% 0 7.98s 6,426 0
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.3 Chat 10.0 10.0 100.0% 0 2.21s 942 0
Step 3.7 Flash 7.3 5.8 83.3% 1 2.29s 2,667 0
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.3 Chat 3.5 4.4 33.3% 2 13.01s 8,264 0
Step 3.7 Flash 5.3 7.2 44.4% 1 43.31s 104,487 0
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.3 Chat 4.6 10.0 0.0% 0 1.99s 319 0
Step 3.7 Flash 3.4 9.3 0.0% 0 7.00s 4,604 0
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.3 Chat 9.8 10.0 100.0% 0 3.51s 1,491 0
Step 3.7 Flash 9.8 10.0 100.0% 0 1.58s 1,857 0
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.3 Chat 10.0 10.0 100.0% 0 2.99s 1,758 0
Step 3.7 Flash 5.5 9.9 33.3% 0 1.84s 3,564 0
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.3 Chat 10.0 10.0 100.0% 0 8.36s 861 0
Step 3.7 Flash 10.0 10.0 100.0% 0 3.25s 1,360 0
معلومات عامہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.3 Chat 3.0 10.0 0.0% 0 4.38s 569 0
Step 3.7 Flash 3.0 10.0 0.0% 0 124.75s 134,779 0

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں