نیویگیشن
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

Anthropic: Claude Opus 4.7 vs Xiaomi: MiMo-V2.5-Pro

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-04-22

میٹرک Claude Opus 4.7 Claude Opus 4.7 none اجرا: 2026-04-16 MiMo-V2.5-Pro MiMo-V2.5-Pro medium اجرا: 2026-04-22
اسکور 9.2 8.1
درجہ #4 #23
تسلسل 10.0 8.8
درست ٹیسٹس
فی کوشش کامیابی کی شرح 88.9% 75.9%
غیر مستحکم ٹیسٹ 0 3
کل رنز 54 54
فی نتیجہ لاگت 3.155 1.674
کل لاگت $0.505 $0.201
?? ?? ???? $5.000 / 1M $1.000 / 1M
??? ?? ???? $25.000 / 1M $3.000 / 1M
آؤٹ پٹ ٹوکنز 6,326 2,735
ریزننگ ٹوکنز 0 52,571
ردِعمل کا وقت (اوسط) 3.13s 16.17s
ردِعمل کا وقت (زیادہ سے زیادہ) 18.27s 84.22s
ردِعمل کا وقت (کل) 56.33s 291.09s

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.7 8.3 10.0 75.0% 0 2.12s 522 0
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 2.95s 273 1,363
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.7 10.0 10.0 100.0% 0 2.84s 494 0
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 32.58s 543 7,485
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.7 9.5 10.0 100.0% 0 18.27s 3,504 0
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 53.36s 348 11,870
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.7 10.0 10.0 100.0% 0 2.15s 324 0
MiMo-V2.5-Pro 7.3 5.8 83.3% 1 18.81s 260 8,383
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.7 7.7 10.0 66.7% 0 1.19s 78 0
MiMo-V2.5-Pro 5.3 10.0 33.3% 0 37.87s 275 17,023
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.7 10.0 10.0 100.0% 0 3.47s 257 0
MiMo-V2.5-Pro 5.1 3.3 33.3% 1 4.27s 150 549
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.7 10.0 10.0 100.0% 0 1.46s 114 0
MiMo-V2.5-Pro 9.9 10.0 100.0% 0 2.77s 82 803
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.7 10.0 10.0 100.0% 0 2.58s 661 0
MiMo-V2.5-Pro 6.7 7.9 55.6% 1 5.16s 493 2,187
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
Claude Opus 4.7 10.0 10.0 100.0% 0 4.74s 372 0
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 16.87s 311 2,908

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں