نیویگیشن
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

xAI: Grok 4.20 Beta vs Xiaomi: MiMo-V2-Omni

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-03-21

میٹرک Grok 4.20 Beta Grok 4.20 Beta medium اجرا: 2026-03-12 MiMo-V2-Omni MiMo-V2-Omni medium اجرا: 2026-03-18
اسکور 7.9 7.9
درجہ #23 #22
تسلسل 9.0 10.0
درست ٹیسٹس
فی کوشش کامیابی کی شرح 72.6% 64.7%
غیر مستحکم ٹیسٹ 2 0
کل رنز 51 17
فی نتیجہ لاگت 5.525 0.763
کل لاگت $0.608 $0.084
?? ?? ???? $2.000 / 1M $0.400 / 1M
??? ?? ???? $6.000 / 1M $2.000 / 1M
آؤٹ پٹ ٹوکنز 1,487 663
ریزننگ ٹوکنز 87,922 39,001
ردِعمل کا وقت (اوسط) 8.54s 13.71s
ردِعمل کا وقت (زیادہ سے زیادہ) 24.21s 158.78s
ردِعمل کا وقت (کل) 145.26s 233.06s

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Grok 4.20 Beta 8.7 7.9 91.7% 1 3.16s 268 7,583
MiMo-V2-Omni 10.0 10.0 100.0% 0 2.11s 112 402
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Grok 4.20 Beta 10.0 10.0 100.0% 0 20.93s 227 12,212
MiMo-V2-Omni 10.0 10.0 100.0% 0 19.29s 131 2,807
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Grok 4.20 Beta 10.0 10.0 100.0% 0 4.01s 180 5,281
MiMo-V2-Omni 10.0 10.0 100.0% 0 2.29s 87 323
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Grok 4.20 Beta 5.3 10.0 33.3% 0 21.33s 251 40,255
MiMo-V2-Omni 3.0 10.0 0.0% 0 55.12s 13 33,279
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Grok 4.20 Beta 10.0 10.0 100.0% 0 5.78s 72 3,440
MiMo-V2-Omni 10.0 10.0 100.0% 0 2.86s 58 202
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Grok 4.20 Beta 8.3 10.0 50.0% 0 4.97s 57 7,107
MiMo-V2-Omni 8.3 10.0 50.0% 0 4.92s 35 201
Puzzle Solving اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Grok 4.20 Beta 8.2 7.2 88.9% 1 3.85s 249 6,660
MiMo-V2-Omni 6.5 10.0 33.3% 0 3.88s 126 481
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Grok 4.20 Beta 3.0 10.0 0.0% 0 12.39s 183 5,384
MiMo-V2-Omni 10.0 10.0 100.0% 0 11.07s 101 1,306

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں