نیویگیشن
AI BENCHY
موازنہ کریں چارٹس
❤️ Made by XCS
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: GPT-5.2 Chat vs StepFun: Step 3.5 Flash

موازنہ کریں:

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-03-03

میٹرک OpenAI: GPT-5.2 Chat none اجرا: 2025-12-11 StepFun: Step 3.5 Flash medium اجرا: 2026-02-01 مفت دستیاب
درجہ #12 #17
اوسط اسکور 7.41 7.00
تسلسل 9.45 8.32
فی نتیجہ لاگت 2.261 0.000
کل لاگت $0.227 $0.000
درست ٹیسٹس
فی کوشش کامیابی کی شرح 73.8% 73.8%
غیر مستحکم ٹیسٹ 1 3
آؤٹ پٹ ٹوکنز 14,267 60,502
ریزننگ ٹوکنز 0 117,044

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
OpenAI: GPT-5.2 Chat 10.00 10.00 100.0% 0 1,651 0
StepFun: Step 3.5 Flash 10.00 10.00 100.0% 0 13,924 17,208
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
OpenAI: GPT-5.2 Chat 9.88 10.00 100.0% 0 980 0
StepFun: Step 3.5 Flash 10.00 10.00 100.0% 0 535 11,548
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
OpenAI: GPT-5.2 Chat 4.00 10.00 33.3% 0 7,810 0
StepFun: Step 3.5 Flash 4.00 7.21 44.4% 1 40,942 74,237
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
OpenAI: GPT-5.2 Chat 5.50 6.13 66.7% 1 1,528 0
StepFun: Step 3.5 Flash 10.00 10.00 100.0% 0 2,121 3,274
Puzzle Solving اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
OpenAI: GPT-5.2 Chat 7.00 10.00 66.7% 0 1,743 0
StepFun: Step 3.5 Flash 2.00 4.96 33.3% 2 2,705 6,975
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
OpenAI: GPT-5.2 Chat 10.00 10.00 100.0% 0 555 0
StepFun: Step 3.5 Flash 10.00 10.00 100.0% 0 275 3,802

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں