نیویگیشن
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

ByteDance Seed: Seed-2.0-Mini vs xAI: Grok Build 0.1

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-05-22

میٹرک Seed-2.0-Mini Seed-2.0-Mini medium اجرا: 2026-02-14 Grok Build 0.1 Grok Build 0.1 none اجرا: 2026-05-21
اسکور 7.1 6.6
درجہ #68 #82
اعتماد پذیری 5.0 10.0
تسلسل 9.2 8.0
درست ٹیسٹس
فی کوشش کامیابی کی شرح 60.0% 60.4%
غیر مستحکم ٹیسٹ 2 4
کل رنز 60 57
فی نتیجہ لاگت 0.394 7.805
کل لاگت $0.044 $0.547
?? ?? ???? $0.100 / 1M $1.000 / 1M
??? ?? ???? $0.400 / 1M $2.000 / 1M
آؤٹ پٹ ٹوکنز 2,485 267,275
ریزننگ ٹوکنز 95,367 0
ردِعمل کا وقت (اوسط) 79.17s 28.69s
ردِعمل کا وقت (زیادہ سے زیادہ) 262.83s 138.35s
ردِعمل کا وقت (کل) 1345.89s 459.00s

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Seed-2.0-Mini 6.6 10.0 50.0% 0 74.75s 360 9,520
Grok Build 0.1 8.7 7.9 91.7% 1 6.30s 11,162 0
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Seed-2.0-Mini 6.8 9.8 50.0% 0 220.48s 464 34,964
Grok Build 0.1 10.0 10.0 100.0% 0 21.41s 16,568 0
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Seed-2.0-Mini 10.0 10.0 100.0% 0 262.83s 404 29,806
Grok Build 0.1 0.0 0.0 0.0% 0 0ms 0 0
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Seed-2.0-Mini 10.0 10.0 100.0% 0 24.27s 246 2,743
Grok Build 0.1 4.7 1.6 66.7% 1 9.33s 6,359 0
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Seed-2.0-Mini 3.0 10.0 0.0% 0 0ms 0 0
Grok Build 0.1 3.6 7.2 22.2% 1 103.71s 179,469 0
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Seed-2.0-Mini 5.1 3.4 33.3% 1 36.65s 213 4,210
Grok Build 0.1 4.3 10.0 0.0% 0 12.47s 6,647 0
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Seed-2.0-Mini 10.0 10.0 100.0% 0 17.47s 69 2,050
Grok Build 0.1 9.8 10.0 100.0% 0 7.36s 8,970 0
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Seed-2.0-Mini 8.2 7.2 88.9% 1 25.85s 457 5,060
Grok Build 0.1 6.4 7.7 55.6% 1 9.55s 14,982 0
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Seed-2.0-Mini 10.0 10.0 100.0% 0 88.68s 222 5,235
Grok Build 0.1 0.0 0.0 0.0% 0 0ms 0 0
معلومات عامہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Seed-2.0-Mini 3.0 10.0 0.0% 0 56.76s 50 1,779
Grok Build 0.1 3.0 10.0 0.0% 0 36.09s 23,118 0

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں