نیویگیشن
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs Qwen: Qwen3.5-35B-A3B

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-03-12

میٹرک Seed-2.0-Lite Seed-2.0-Lite none اجرا: 2026-02-14 Qwen3.5-35B-A3B Qwen3.5-35B-A3B medium اجرا: 2026-02-24
درجہ #45 #39
اوسط اسکور 4.9 5.5
تسلسل 7.4 6.3
فی نتیجہ لاگت 0.214 4.251
کل لاگت $0.015 $0.341
درست ٹیسٹس
فی کوشش کامیابی کی شرح 56.3% 77.1%
غیر مستحکم ٹیسٹ 5 7
کل رنز 48 48
آؤٹ پٹ ٹوکنز 2,743 5,495
ریزننگ ٹوکنز 0 169,266
ردِعمل کا وقت (اوسط) 2.49s 43.93s
ردِعمل کا وقت (زیادہ سے زیادہ) 6.70s 106.00s
ردِعمل کا وقت (کل) 39.91s 702.85s

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اوسط اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اوسط اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Seed-2.0-Lite 10.0 4.6 22.2% 2 2.93s 703 0
Qwen3.5-35B-A3B 10.0 10.0 100.0% 0 21.75s 429 36,235
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Seed-2.0-Lite 10.0 10.0 0.0% 0 6.59s 498 0
Qwen3.5-35B-A3B 10.0 1.6 66.7% 1 75.34s 775 12,485
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Seed-2.0-Lite 9.9 10.0 100.0% 0 1.82s 246 0
Qwen3.5-35B-A3B 5.5 5.9 83.3% 1 59.33s 235 19,493
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Seed-2.0-Lite 10.0 7.2 22.2% 1 1.33s 17 0
Qwen3.5-35B-A3B 10.0 4.4 44.5% 2 88.34s 41 46,368
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Seed-2.0-Lite 10.0 10.0 100.0% 0 3.45s 294 0
Qwen3.5-35B-A3B 10.0 1.6 33.3% 1 30.30s 20 3,753
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Seed-2.0-Lite 10.0 10.0 100.0% 0 1.06s 73 0
Qwen3.5-35B-A3B 10.0 10.0 100.0% 0 24.45s 97 17,361
Puzzle Solving اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Seed-2.0-Lite 4.0 4.4 55.6% 2 2.46s 620 0
Qwen3.5-35B-A3B 4.0 4.4 77.8% 2 31.58s 3,589 32,206
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Seed-2.0-Lite 10.0 10.0 100.0% 0 3.94s 292 0
Qwen3.5-35B-A3B 10.0 10.0 100.0% 0 4.65s 309 1,365

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں