نیویگیشن
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Google: Gemini 3.1 Flash Lite Preview vs StepFun: Step 3.5 Flash

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-04-16

میٹرک Gemini 3.1 Flash Lite Preview Gemini 3.1 Flash Lite Preview none اجرا: 2026-03-03 Step 3.5 Flash Step 3.5 Flash medium اجرا: 2026-02-01
اسکور 7.9 7.9
درجہ #29 #30
تسلسل 9.6 9.1
درست ٹیسٹس
فی کوشش کامیابی کی شرح 70.4% 70.6%
غیر مستحکم ٹیسٹ 1 2
کل رنز 54 49
فی نتیجہ لاگت 0.130 0.000
کل لاگت $0.016 $0.000
?? ?? ???? $0.250 / 1M $0.100 / 1M
??? ?? ???? $1.500 / 1M $0.300 / 1M
آؤٹ پٹ ٹوکنز 5,361 71,904
ریزننگ ٹوکنز 0 155,607
ردِعمل کا وقت (اوسط) 1.30s 26.78s
ردِعمل کا وقت (زیادہ سے زیادہ) 3.39s 170.45s
ردِعمل کا وقت (کل) 23.42s 294.58s

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.1 Flash Lite Preview 7.5 8.4 66.7% 1 1.04s 1,092 0
Step 3.5 Flash 10.0 10.0 100.0% 0 13.56s 14,376 17,668
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.47s 640 0
Step 3.5 Flash - - - - - - - -
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.1 Flash Lite Preview 3.0 10.0 0.0% 0 3.20s 339 0
Step 3.5 Flash 10.0 10.0 100.0% 0 29.57s 1,176 12,984
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.22s 399 0
Step 3.5 Flash 10.0 10.0 100.0% 0 15.01s 600 13,886
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.1 Flash Lite Preview 5.3 10.0 33.3% 0 942ms 568 0
Step 3.5 Flash 5.3 7.2 44.4% 1 170.45s 45,350 90,436
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.1 Flash Lite Preview 4.0 10.0 0.0% 0 741ms 69 0
Step 3.5 Flash 5.5 10.0 0.0% 0 6.54s 2,214 2,584
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 1.13s 574 0
Step 3.5 Flash 8.5 6.8 83.3% 1 4.98s 2,284 3,412
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 972ms 898 0
Step 3.5 Flash 5.3 10.0 33.3% 0 7.72s 5,629 10,835
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Gemini 3.1 Flash Lite Preview 10.0 10.0 100.0% 0 3.39s 782 0
Step 3.5 Flash 10.0 10.0 100.0% 0 11.91s 275 3,802

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں