نیویگیشن
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

xAI: Grok 4.3 vs Xiaomi: MiMo-V2.5-Pro

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-05-22

میٹرک Grok 4.3 Grok 4.3 medium اجرا: 2026-05-01 MiMo-V2.5-Pro MiMo-V2.5-Pro medium اجرا: 2026-04-22
اسکور 7.8 7.6
درجہ #31 #40
اعتماد پذیری 10.0 10.0
تسلسل 8.4 8.9
درست ٹیسٹس
فی کوشش کامیابی کی شرح 75.0% 68.3%
غیر مستحکم ٹیسٹ 4 3
کل رنز 60 60
فی نتیجہ لاگت 4.562 2.407
کل لاگت $0.593 $0.289
?? ?? ???? $1.250 / 1M $1.000 / 1M
??? ?? ???? $2.500 / 1M $3.000 / 1M
آؤٹ پٹ ٹوکنز 1,485 4,957
ریزننگ ٹوکنز 214,928 80,301
ردِعمل کا وقت (اوسط) 49.23s 21.77s
ردِعمل کا وقت (زیادہ سے زیادہ) 216.69s 130.77s
ردِعمل کا وقت (کل) 984.54s 435.33s

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Grok 4.3 10.0 10.0 100.0% 0 8.83s 88 8,207
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 3.26s 323 1,179
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Grok 4.3 7.4 6.5 66.7% 1 55.26s 532 24,554
MiMo-V2.5-Pro 7.0 6.2 66.7% 1 81.67s 769 33,771
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Grok 4.3 10.0 10.0 100.0% 0 63.99s 234 15,301
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 53.36s 348 11,870
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Grok 4.3 10.0 10.0 100.0% 0 18.97s 180 9,546
MiMo-V2.5-Pro 7.3 5.8 83.3% 1 18.81s 260 8,383
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Grok 4.3 5.3 7.2 44.4% 1 181.74s 14 111,300
MiMo-V2.5-Pro 5.3 10.0 33.3% 0 37.87s 275 17,023
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Grok 4.3 5.4 2.5 66.7% 1 24.70s 70 5,020
MiMo-V2.5-Pro 5.5 10.0 0.0% 0 4.02s 155 163
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Grok 4.3 9.8 10.0 100.0% 0 18.58s 57 8,713
MiMo-V2.5-Pro 9.9 10.0 100.0% 0 2.77s 82 803
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Grok 4.3 5.9 7.2 55.6% 1 22.53s 128 14,686
MiMo-V2.5-Pro 6.7 7.9 55.6% 1 5.16s 493 2,187
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Grok 4.3 10.0 10.0 100.0% 0 17.66s 168 4,615
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 16.87s 311 2,908
معلومات عامہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Grok 4.3 3.0 10.0 0.0% 0 44.47s 14 12,986
MiMo-V2.5-Pro 3.0 10.0 0.0% 0 12.46s 1,941 2,014

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں