نیویگیشن
AI BENCHY
موازنہ کریں چارٹس
❤️ Made by XCS
Your ad here

AI BENCHY Compare

OpenAI: GPT-5.3-Codex vs StepFun: Step 3.5 Flash

ماڈل کا نام:

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے : 2026-02-27 15:16

خلاصہ

میٹرک OpenAI: GPT-5.3-Codex medium اجرا: ریلیز کی تاریخ نامعلوم StepFun: Step 3.5 Flash medium اجرا: ریلیز کی تاریخ نامعلوم مفت دستیاب
درجہ #7 #11
اسکور 7.93 7.00
تسلسل 8.84 8.32
فی نتیجہ لاگت 4.641 0.000
کل لاگت $0.465 $0.000
درست ٹیسٹس
غلط ٹیسٹس 4 5
فی کوشش کامیابی کی شرح 78.6% 73.8%
غیر مستحکم ٹیسٹ 2 3
آؤٹ پٹ ٹوکنز 1,201 60,502
ریزننگ ٹوکنز 30,056 117,044

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
OpenAI: GPT-5.3-Codex 10.00 10.00 100.0% 0 216 1,421
StepFun: Step 3.5 Flash 10.00 10.00 100.0% 0 13,924 17,208
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
OpenAI: GPT-5.3-Codex 10.00 10.00 100.0% 0 234 735
StepFun: Step 3.5 Flash 10.00 10.00 100.0% 0 535 11,548
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
OpenAI: GPT-5.3-Codex 4.00 7.21 55.6% 1 64 25,308
StepFun: Step 3.5 Flash 4.00 7.21 44.4% 1 40,942 74,237
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
OpenAI: GPT-5.3-Codex 9.00 10.00 50.0% 0 93 693
StepFun: Step 3.5 Flash 10.00 10.00 100.0% 0 2,121 3,274
Puzzle Solving اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
OpenAI: GPT-5.3-Codex 7.00 7.38 77.8% 1 340 1,407
StepFun: Step 3.5 Flash 2.00 4.96 33.3% 2 2,705 6,975
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
OpenAI: GPT-5.3-Codex 10.00 10.00 100.0% 0 254 492
StepFun: Step 3.5 Flash 10.00 10.00 100.0% 0 275 3,802

موازنہ کی جوڑی تبدیل کریں