نیویگیشن
AI BENCHY
Your ad here

AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs Qwen: Qwen3.5-Flash

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-03-12

میٹرک Seed-2.0-Lite Seed-2.0-Lite none اجرا: 2026-02-14 Qwen3.5-Flash Qwen3.5-Flash none اجرا: 2026-02-24
درجہ #45 #41
اوسط اسکور 4.9 5.2
تسلسل 7.4 9.6
فی نتیجہ لاگت 0.214 0.077
کل لاگت $0.015 $0.006
درست ٹیسٹس
فی کوشش کامیابی کی شرح 56.3% 45.8%
غیر مستحکم ٹیسٹ 5 1
کل رنز 48 48
آؤٹ پٹ ٹوکنز 2,743 3,774
ریزننگ ٹوکنز 0 0
ردِعمل کا وقت (اوسط) 2.49s 3.54s
ردِعمل کا وقت (زیادہ سے زیادہ) 6.70s 13.73s
ردِعمل کا وقت (کل) 39.91s 56.70s

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اوسط اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اوسط اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Seed-2.0-Lite 10.0 4.6 22.2% 2 2.93s 703 0
Qwen3.5-Flash 2.3 7.8 11.1% 1 1.62s 687 0
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Seed-2.0-Lite 10.0 10.0 0.0% 0 6.59s 498 0
Qwen3.5-Flash 10.0 10.0 0.0% 0 6.22s 1,794 0
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Seed-2.0-Lite 9.9 10.0 100.0% 0 1.82s 246 0
Qwen3.5-Flash 9.9 10.0 100.0% 0 1.57s 243 0
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Seed-2.0-Lite 10.0 7.2 22.2% 1 1.33s 17 0
Qwen3.5-Flash 7.0 10.0 66.7% 0 905ms 15 0
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Seed-2.0-Lite 10.0 10.0 100.0% 0 3.45s 294 0
Qwen3.5-Flash 10.0 10.0 100.0% 0 803ms 100 0
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Seed-2.0-Lite 10.0 10.0 100.0% 0 1.06s 73 0
Qwen3.5-Flash 5.0 10.0 50.0% 0 8.81s 63 0
Puzzle Solving اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Seed-2.0-Lite 4.0 4.4 55.6% 2 2.46s 620 0
Qwen3.5-Flash 1.3 10.0 0.0% 0 5.90s 608 0
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Seed-2.0-Lite 10.0 10.0 100.0% 0 3.94s 292 0
Qwen3.5-Flash 10.0 10.0 100.0% 0 3.67s 264 0

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں