نیویگیشن
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: gpt-oss-120b vs Xiaomi: MiMo-V2-Pro

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-03-20

میٹرک gpt-oss-120b gpt-oss-120b medium اجرا: 2025-08-05 مفت دستیاب MiMo-V2-Pro MiMo-V2-Pro none اجرا: 2026-03-18
اسکور 6.0 5.8
درجہ #47 #54
تسلسل 7.6 8.5
درست ٹیسٹس
فی کوشش کامیابی کی شرح 51.0% 45.1%
غیر مستحکم ٹیسٹ 5 3
کل رنز 51 51
فی نتیجہ لاگت 0.136 0.659
کل لاگت $0.010 $0.040
?? ?? ???? $0.039 / 1M $1.000 / 1M
??? ?? ???? $0.190 / 1M $3.000 / 1M
آؤٹ پٹ ٹوکنز 13,265 1,721
ریزننگ ٹوکنز 34,330 0
ردِعمل کا وقت (اوسط) 15.05s 2.31s
ردِعمل کا وقت (زیادہ سے زیادہ) 50.92s 6.58s
ردِعمل کا وقت (کل) 150.55s 39.25s

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
gpt-oss-120b 6.7 9.9 50.0% 0 10.21s 3,518 2,177
MiMo-V2-Pro 3.5 8.0 16.7% 1 1.80s 315 0
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
gpt-oss-120b 10.0 10.0 100.0% 0 31.18s 694 5,072
MiMo-V2-Pro 3.0 10.0 0.0% 0 6.58s 333 0
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
gpt-oss-120b 6.4 5.9 66.7% 1 1.98s 241 1,114
MiMo-V2-Pro 10.0 10.0 100.0% 0 1.39s 249 0
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
gpt-oss-120b 2.9 4.4 22.2% 2 50.92s 6,784 20,606
MiMo-V2-Pro 5.3 7.2 44.4% 1 1.78s 26 0
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
gpt-oss-120b 4.3 10.0 0.0% 0 7.90s 107 387
MiMo-V2-Pro 4.3 9.9 0.0% 0 2.44s 125 0
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
gpt-oss-120b 9.9 10.0 100.0% 0 7.63s 126 1,799
MiMo-V2-Pro 6.5 10.0 50.0% 0 2.51s 69 0
Puzzle Solving اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
gpt-oss-120b 3.2 4.7 22.2% 2 11.80s 1,508 2,092
MiMo-V2-Pro 6.0 7.1 55.6% 1 1.83s 327 0
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
gpt-oss-120b 9.8 10.0 100.0% 0 6.91s 287 1,083
MiMo-V2-Pro 10.0 10.0 100.0% 0 4.39s 277 0

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں