نیویگیشن
AI BENCHY
Your ad here

AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs Qwen: Qwen3.6 35B A3B

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-04-27

میٹرک Seed-2.0-Lite Seed-2.0-Lite medium اجرا: 2026-02-14 Qwen3.6 35B A3B Qwen3.6 35B A3B medium اجرا: 2026-04-20
اسکور 8.6 8.8
درجہ #10 #9
اعتماد پذیری دستیاب نہیں 10.0
تسلسل 8.8 9.5
درست ٹیسٹس
فی کوشش کامیابی کی شرح 83.3% 83.3%
غیر مستحکم ٹیسٹ 3 1
کل رنز 54 54
فی نتیجہ لاگت 0.926 0.800
کل لاگت $0.121 $0.104
?? ?? ???? $0.250 / 1M $0.162 / 1M
??? ?? ???? $2.000 / 1M $0.966 / 1M
آؤٹ پٹ ٹوکنز 3,257 14,256
ریزننگ ٹوکنز 52,042 98,005
ردِعمل کا وقت (اوسط) 30.37s 11.98s
ردِعمل کا وقت (زیادہ سے زیادہ) 168.71s 45.02s
ردِعمل کا وقت (کل) 546.72s 191.76s

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Seed-2.0-Lite 8.3 10.0 75.0% 0 17.99s 996 7,142
Qwen3.6 35B A3B 10.0 10.0 100.0% 0 6.02s 1,154 12,385
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Seed-2.0-Lite 10.0 10.0 100.0% 0 74.49s 436 7,319
Qwen3.6 35B A3B 10.0 10.0 100.0% 0 32.58s 3,294 15,116
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Seed-2.0-Lite 10.0 10.0 100.0% 0 37.67s 506 4,299
Qwen3.6 35B A3B 0.0 0.0 0.0% 0 0ms 0 0
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Seed-2.0-Lite 10.0 10.0 100.0% 0 9.07s 246 1,742
Qwen3.6 35B A3B 10.0 10.0 100.0% 0 12.99s 2,591 9,968
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Seed-2.0-Lite 5.9 7.2 55.6% 1 88.74s 15 23,897
Qwen3.6 35B A3B 5.3 7.2 44.4% 1 22.50s 6,193 39,116
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Seed-2.0-Lite 6.7 3.6 66.7% 1 18.25s 304 1,620
Qwen3.6 35B A3B 4.4 9.9 0.0% 0 8.66s 129 4,569
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Seed-2.0-Lite 10.0 10.0 100.0% 0 7.26s 71 1,480
Qwen3.6 35B A3B 10.0 10.0 100.0% 0 7.50s 219 7,404
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Seed-2.0-Lite 9.0 7.9 88.9% 1 11.03s 461 3,532
Qwen3.6 35B A3B 10.0 10.0 100.0% 0 5.98s 676 9,447
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Seed-2.0-Lite 10.0 10.0 100.0% 0 12.38s 222 1,011
Qwen3.6 35B A3B 0.0 0.0 0.0% 0 0ms 0 0

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں