نیویگیشن
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Anthropic: Claude Opus 4.7 vs Xiaomi: MiMo-V2.5

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-04-22

میٹرک Claude Opus 4.7 Claude Opus 4.7 none اجرا: 2026-04-16 MiMo-V2.5 MiMo-V2.5 medium اجرا: 2026-04-22
اسکور 9.2 7.8
درجہ #4 #35
تسلسل 10.0 8.6
درست ٹیسٹس
فی کوشش کامیابی کی شرح 88.9% 74.1%
غیر مستحکم ٹیسٹ 0 3
کل رنز 54 54
فی نتیجہ لاگت 3.155 2.102
کل لاگت $0.505 $0.253
?? ?? ???? $5.000 / 1M $0.400 / 1M
??? ?? ???? $25.000 / 1M $2.000 / 1M
آؤٹ پٹ ٹوکنز 6,326 2,840
ریزننگ ٹوکنز 0 116,242
ردِعمل کا وقت (اوسط) 3.13s 13.71s
ردِعمل کا وقت (زیادہ سے زیادہ) 18.27s 86.93s
ردِعمل کا وقت (کل) 56.33s 246.73s

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.7 8.3 10.0 75.0% 0 2.12s 522 0
MiMo-V2.5 10.0 10.0 100.0% 0 1.98s 303 2,022
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.7 10.0 10.0 100.0% 0 2.84s 494 0
MiMo-V2.5 10.0 10.0 100.0% 0 31.48s 488 14,813
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.7 9.5 10.0 100.0% 0 18.27s 3,504 0
MiMo-V2.5 10.0 10.0 100.0% 0 16.86s 363 7,609
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.7 10.0 10.0 100.0% 0 2.15s 324 0
MiMo-V2.5 2.7 5.7 16.7% 1 6.33s 306 5,714
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.7 7.7 10.0 66.7% 0 1.19s 78 0
MiMo-V2.5 5.3 10.0 33.3% 0 34.53s 507 49,478
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.7 10.0 10.0 100.0% 0 3.47s 257 0
MiMo-V2.5 3.8 2.5 33.3% 1 1.55s 118 170
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.7 10.0 10.0 100.0% 0 1.46s 114 0
MiMo-V2.5 9.9 10.0 100.0% 0 1.80s 88 801
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.7 10.0 10.0 100.0% 0 2.58s 661 0
MiMo-V2.5 8.2 7.2 88.9% 1 20.60s 364 33,211
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.7 10.0 10.0 100.0% 0 4.74s 372 0
MiMo-V2.5 10.0 10.0 100.0% 0 7.29s 303 2,424

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں