نیویگیشن
AI BENCHY
موازنہ کریں چارٹس
❤️ Made by XCS
Your ad here

AI BENCHY Compare

OpenAI: GPT-5 Mini vs StepFun: Step 3.5 Flash

موازنہ کریں:

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-03-03

میٹرک OpenAI: GPT-5 Mini medium اجرا: 2025-08-07 StepFun: Step 3.5 Flash medium اجرا: 2026-02-01 مفت دستیاب
درجہ #33 #17
اوسط اسکور 5.77 7.00
تسلسل 8.79 8.32
فی نتیجہ لاگت 1.200 0.000
کل لاگت $0.084 $0.000
درست ٹیسٹس
فی کوشش کامیابی کی شرح 57.1% 73.8%
غیر مستحکم ٹیسٹ 2 3
آؤٹ پٹ ٹوکنز 4,723 60,502
ریزننگ ٹوکنز 35,392 117,044

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
OpenAI: GPT-5 Mini 7.00 9.62 66.7% 0 1,645 5,824
StepFun: Step 3.5 Flash 10.00 10.00 100.0% 0 13,924 17,208
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
OpenAI: GPT-5 Mini 9.88 10.00 100.0% 0 453 3,200
StepFun: Step 3.5 Flash 10.00 10.00 100.0% 0 535 11,548
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
OpenAI: GPT-5 Mini 1.00 7.21 22.2% 1 293 14,016
StepFun: Step 3.5 Flash 4.00 7.21 44.4% 1 40,942 74,237
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
OpenAI: GPT-5 Mini 7.00 6.64 66.7% 1 318 4,992
StepFun: Step 3.5 Flash 10.00 10.00 100.0% 0 2,121 3,274
Puzzle Solving اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
OpenAI: GPT-5 Mini 4.33 9.78 33.3% 0 1,527 5,760
StepFun: Step 3.5 Flash 2.00 4.96 33.3% 2 2,705 6,975
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
OpenAI: GPT-5 Mini 10.00 10.00 100.0% 0 487 1,600
StepFun: Step 3.5 Flash 10.00 10.00 100.0% 0 275 3,802

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں