نیویگیشن
AI BENCHY
موازنہ کریں چارٹس
❤️ Made by XCS
Your ad here

AI BENCHY Compare

Qwen: Qwen3.5-122B-A10B vs StepFun: Step 3.5 Flash

ماڈل کا نام:

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے : 2026-02-27 15:16

خلاصہ

میٹرک Qwen: Qwen3.5-122B-A10B none اجرا: ریلیز کی تاریخ نامعلوم StepFun: Step 3.5 Flash medium اجرا: ریلیز کی تاریخ نامعلوم مفت دستیاب
درجہ #27 #11
اسکور 5.20 7.00
تسلسل 9.99 8.32
فی نتیجہ لاگت 0.206 0.000
کل لاگت $0.013 $0.000
درست ٹیسٹس
غلط ٹیسٹس 8 5
فی کوشش کامیابی کی شرح 42.9% 73.8%
غیر مستحکم ٹیسٹ 0 3
آؤٹ پٹ ٹوکنز 1,515 60,502
ریزننگ ٹوکنز 0 117,044

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Qwen: Qwen3.5-122B-A10B 4.00 10.00 33.3% 0 309 0
StepFun: Step 3.5 Flash 10.00 10.00 100.0% 0 13,924 17,208
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Qwen: Qwen3.5-122B-A10B 9.88 10.00 100.0% 0 243 0
StepFun: Step 3.5 Flash 10.00 10.00 100.0% 0 535 11,548
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Qwen: Qwen3.5-122B-A10B 4.00 10.00 33.3% 0 15 0
StepFun: Step 3.5 Flash 4.00 7.21 44.4% 1 40,942 74,237
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Qwen: Qwen3.5-122B-A10B 3.00 9.95 0.0% 0 70 0
StepFun: Step 3.5 Flash 10.00 10.00 100.0% 0 2,121 3,274
Puzzle Solving اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Qwen: Qwen3.5-122B-A10B 4.33 10.00 33.3% 0 614 0
StepFun: Step 3.5 Flash 2.00 4.96 33.3% 2 2,705 6,975
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Qwen: Qwen3.5-122B-A10B 10.00 10.00 100.0% 0 264 0
StepFun: Step 3.5 Flash 10.00 10.00 100.0% 0 275 3,802

موازنہ کی جوڑی تبدیل کریں