نیویگیشن
AI BENCHY
موازنہ کریں چارٹس طریقہ کار
❤️ Made by XCS
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 3.1 Pro Preview vs StepFun: Step 3.5 Flash

موازنہ کریں:

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-03-06

میٹرک Google: Gemini 3.1 Pro Preview medium اجرا: 2026-02-19 StepFun: Step 3.5 Flash medium اجرا: 2026-02-01 مفت دستیاب
درجہ #2 #13
اوسط اسکور 9.4 7.4
تسلسل 10.0 9.1
فی نتیجہ لاگت 3.417 0.000
کل لاگت $0.513 $0.000
درست ٹیسٹس
فی کوشش کامیابی کی شرح 93.8% 68.8%
غیر مستحکم ٹیسٹ 0 2
کل رنز 48 (16 x 3) 48 (16 x 3)
آؤٹ پٹ ٹوکنز 1,521 71,452
ریزننگ ٹوکنز 35,656 155,147
ردِعمل کا وقت (اوسط) 16.60s 29.10s
ردِعمل کا وقت (زیادہ سے زیادہ) 40.61s 170.45s
ردِعمل کا وقت (کل) 149.36s 290.96s

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اوسط اسکور vs ردِعمل کا وقت (اوسط)

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Google: Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 9.52s 106 2,533
StepFun: Step 3.5 Flash 10.0 10.0 100.0% 0 18.54s 13,924 17,208
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Google: Gemini 3.1 Pro Preview 9.0 10.0 100.0% 0 40.61s 432 9,281
StepFun: Step 3.5 Flash 10.0 10.0 100.0% 0 29.57s 1,176 12,984
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Google: Gemini 3.1 Pro Preview 9.9 10.0 100.0% 0 7.72s 279 3,904
StepFun: Step 3.5 Flash 10.0 10.0 100.0% 0 15.01s 600 13,886
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Google: Gemini 3.1 Pro Preview 7.0 10.0 66.7% 0 32.73s 18 12,424
StepFun: Step 3.5 Flash 4.0 7.2 44.4% 1 170.45s 45,350 90,436
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Google: Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 11.77s 108 1,179
StepFun: Step 3.5 Flash 6.0 10.0 0.0% 0 6.54s 2,214 2,584
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Google: Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 9.56s 72 2,236
StepFun: Step 3.5 Flash 9.0 6.8 83.3% 1 4.98s 2,284 3,412
Puzzle Solving اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Google: Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 7.15s 232 3,117
StepFun: Step 3.5 Flash 4.0 10.0 33.3% 0 7.72s 5,629 10,835
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Google: Gemini 3.1 Pro Preview 10.0 10.0 100.0% 0 23.15s 274 982
StepFun: Step 3.5 Flash 10.0 10.0 100.0% 0 11.91s 275 3,802

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں