نیویگیشن
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: GPT-5.5 vs StepFun: Step 3.7 Flash

خلاصہ

GPT-5.5 vs Step 3.7 Flash benchmark موازنہ: GPT-5.5 average score میں آگے ہے: 9.3 vs 8.5. Step 3.7 Flash کی benchmark لاگت کم ہے: $0.376 vs $0.907. GPT-5.5 تیز ہے: 9.76s vs 20.35s، pass rates 85.7% vs 73.0%.

تجویز کردہ ماڈل: GPT-5.5 - It has the best score here (9.3), while responding about 2.1x faster than Step 3.7 Flash.

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-06-12

میٹرک GPT-5.5 GPT-5.5 low اجرا: 2026-04-24 Step 3.7 Flash Step 3.7 Flash medium اجرا: 2026-05-29
اسکور 9.3 8.5
درجہ #5 #23
اعتماد پذیری 10.0 9.9
تسلسل 10.0 9.3
درست ٹیسٹس
فی کوشش کامیابی کی شرح 85.7% 73.0%
غیر مستحکم ٹیسٹ 0 2
کل رنز 63 61
فی نتیجہ لاگت 5.035 2.686
کل لاگت $0.907 $0.376
ان پٹ قیمت $5.000 / 1M $0.200 / 1M
آؤٹ پٹ قیمت $30.000 / 1M $1.150 / 1M
کل ان پٹ ٹوکنز 34,209 39,981
آؤٹ پٹ ٹوکنز 2,046 319,958
ریزننگ ٹوکنز 22,460 0
ردِعمل کا وقت (اوسط) 9.76s 20.35s
ردِعمل کا وقت (زیادہ سے زیادہ) 56.19s 113.98s
ردِعمل کا وقت (کل) 204.92s 427.42s

Generation showcase

Hamster playing table tennis

Prompt: Create a detailed SVG illustration of a hamster playing table tennis.

#5 GPT-5.5

low
Cost
$0.068
Time
37.0s
Tokens
2,339 tok

#23 Step 3.7 Flash

medium
Cost
$0.006
Time
46.2s
Tokens
4,466 tok

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.5 10.0 10.0 100.0% 0 4.41s 606 238 1,020
Step 3.7 Flash 8.7 7.9 91.7% 1 9.65s 756 32,185 0
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.5 10.0 10.0 100.0% 0 15.04s 7,302 423 6,402
Step 3.7 Flash 8.8 7.8 88.9% 1 27.42s 7,437 44,797 0
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.5 10.0 10.0 100.0% 0 9.56s 11,019 303 717
Step 3.7 Flash 10.0 10.0 100.0% 0 9.06s 13,683 7,106 0
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.5 10.0 10.0 100.0% 0 3.28s 7,140 228 157
Step 3.7 Flash 10.0 10.0 100.0% 0 2.75s 7,398 3,020 0
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.5 5.3 10.0 33.3% 0 28.05s 723 69 11,609
Step 3.7 Flash 7.7 10.0 66.7% 0 48.27s 708 70,347 0
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.5 10.0 10.0 100.0% 0 5.17s 477 133 245
Step 3.7 Flash 4.0 10.0 0.0% 0 6.85s 525 3,987 0
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.5 9.9 10.0 100.0% 0 3.74s 660 93 415
Step 3.7 Flash 9.8 10.0 100.0% 0 1.83s 735 2,166 0
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.5 10.0 10.0 100.0% 0 4.74s 642 279 954
Step 3.7 Flash 5.7 9.9 33.3% 0 6.19s 756 15,071 0
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.5 10.0 10.0 100.0% 0 4.96s 5,445 250 101
Step 3.7 Flash 10.0 10.0 100.0% 0 4.16s 7,746 2,115 0
معلومات عامہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) ان پٹ ٹوکنز آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.5 3.0 10.0 0.0% 0 10.06s 195 30 840
Step 3.7 Flash 3.0 10.0 0.0% 0 113.98s 237 139,164 0

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں