نیویگیشن
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

ByteDance Seed: Seed-2.0-Lite vs Inception: Mercury 2

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-04-26

میٹرک Seed-2.0-Lite Seed-2.0-Lite none اجرا: 2026-02-14 Mercury 2 Mercury 2 medium اجرا: 2026-02-24
اسکور 6.2 6.5
درجہ #72 #65
اعتماد پذیری دستیاب نہیں دستیاب نہیں
تسلسل 7.7 8.6
درست ٹیسٹس
فی کوشش کامیابی کی شرح 55.6% 53.7%
غیر مستحکم ٹیسٹ 5 3
کل رنز 54 54
فی نتیجہ لاگت 0.200 0.580
کل لاگت $0.016 $0.047
?? ?? ???? $0.250 / 1M $0.250 / 1M
??? ?? ???? $2.000 / 1M $0.750 / 1M
آؤٹ پٹ ٹوکنز 3,129 3,972
ریزننگ ٹوکنز 0 48,333
ردِعمل کا وقت (اوسط) 2.53s 2.21s
ردِعمل کا وقت (زیادہ سے زیادہ) 6.70s 14.63s
ردِعمل کا وقت (کل) 45.46s 37.51s

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Seed-2.0-Lite 3.0 5.9 16.7% 2 2.43s 709 0
Mercury 2 6.9 9.9 50.0% 0 1.12s 2,546 2,609
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Seed-2.0-Lite 10.0 10.0 100.0% 0 4.61s 380 0
Mercury 2 10.0 10.0 100.0% 0 1.53s 249 2,213
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Seed-2.0-Lite 3.0 10.0 0.0% 0 6.59s 498 0
Mercury 2 10.0 10.0 100.0% 0 3.28s 268 4,887
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Seed-2.0-Lite 10.0 10.0 100.0% 0 1.82s 246 0
Mercury 2 7.3 5.9 83.3% 1 1.11s 183 1,656
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Seed-2.0-Lite 3.6 7.2 22.2% 1 1.33s 17 0
Mercury 2 2.9 7.2 11.1% 1 6.48s 41 30,754
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Seed-2.0-Lite 10.0 10.0 100.0% 0 3.45s 294 0
Mercury 2 4.8 10.0 0.0% 0 821ms 137 542
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Seed-2.0-Lite 10.0 10.0 100.0% 0 1.06s 73 0
Mercury 2 10.0 10.0 100.0% 0 1.07s 14 958
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Seed-2.0-Lite 5.2 4.4 55.6% 2 2.46s 620 0
Mercury 2 3.9 7.5 22.2% 1 934ms 354 2,758
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Seed-2.0-Lite 10.0 10.0 100.0% 0 3.94s 292 0
Mercury 2 10.0 10.0 100.0% 0 1.89s 180 1,956

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں