نیویگیشن
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

xAI: Grok 4.20 Multi-Agent Beta vs Xiaomi: MiMo-V2-Omni

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-03-21

میٹرک Grok 4.20 Multi-Agent Beta Grok 4.20 Multi-Agent Beta medium اجرا: 2026-03-12 MiMo-V2-Omni MiMo-V2-Omni none اجرا: 2026-03-18
اسکور 6.2 6.4
درجہ #47 #43
تسلسل 7.2 10.0
درست ٹیسٹس
فی کوشش کامیابی کی شرح 54.9% 47.1%
غیر مستحکم ٹیسٹ 6 0
کل رنز 51 17
فی نتیجہ لاگت 82.962 0.069
کل لاگت $4.978 $0.006
?? ?? ???? $2.000 / 1M $0.400 / 1M
??? ?? ???? $6.000 / 1M $2.000 / 1M
آؤٹ پٹ ٹوکنز 298,948 469
ریزننگ ٹوکنز 296,529 0
ردِعمل کا وقت (اوسط) 8.64s 2.01s
ردِعمل کا وقت (زیادہ سے زیادہ) 35.28s 6.81s
ردِعمل کا وقت (کل) 129.64s 34.09s

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Grok 4.20 Multi-Agent Beta 6.9 5.8 75.0% 2 3.46s 33,706 33,077
MiMo-V2-Omni 4.8 10.0 25.0% 0 1.10s 74 0
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Grok 4.20 Multi-Agent Beta 3.0 10.0 0.0% 0 0ms 0 0
MiMo-V2-Omni 3.0 10.0 0.0% 0 2.47s 110 0
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Grok 4.20 Multi-Agent Beta 10.0 10.0 100.0% 0 5.54s 25,306 25,051
MiMo-V2-Omni 10.0 10.0 100.0% 0 1.69s 83 0
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Grok 4.20 Multi-Agent Beta 2.9 7.2 11.1% 1 24.67s 164,609 163,647
MiMo-V2-Omni 5.3 10.0 33.3% 0 1.14s 8 0
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Grok 4.20 Multi-Agent Beta 5.8 2.8 66.7% 1 6.40s 15,848 15,746
MiMo-V2-Omni 4.5 10.0 0.0% 0 1.19s 37 0
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Grok 4.20 Multi-Agent Beta 8.3 10.0 50.0% 0 4.63s 25,457 25,322
MiMo-V2-Omni 6.5 10.0 50.0% 0 4.18s 22 0
Puzzle Solving اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Grok 4.20 Multi-Agent Beta 7.2 5.1 77.8% 2 5.01s 34,022 33,686
MiMo-V2-Omni 8.0 10.0 66.7% 0 2.71s 58 0
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Grok 4.20 Multi-Agent Beta 3.0 10.0 0.0% 0 0ms 0 0
MiMo-V2-Omni 10.0 10.0 100.0% 0 2.76s 77 0

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں