نیویگیشن
AI BENCHY
AD
Track all your projects in one dashboard. Get 📊stats, 🔥heatmaps and 👀recordings in one self-hosted dashboard.
uxwizz.com

AI BENCHY Compare

OpenAI: GPT-5.3-Codex vs Xiaomi: MiMo-V2.5-Pro

بینچ مارکس AI BENCHY ٹیسٹ سوئٹس سے اس وقت تیار کیے گئے: 2026-05-08

میٹرک GPT-5.3-Codex GPT-5.3-Codex medium اجرا: 2026-02-05 MiMo-V2.5-Pro MiMo-V2.5-Pro medium اجرا: 2026-04-22
اسکور 8.2 8.1
درجہ #13 #18
اعتماد پذیری 10.0 10.0
تسلسل 8.3 9.2
درست ٹیسٹس
فی کوشش کامیابی کی شرح 80.7% 74.1%
غیر مستحکم ٹیسٹ 4 2
کل رنز 57 54
فی نتیجہ لاگت 4.594 1.661
کل لاگت $0.598 $0.200
?? ?? ???? $1.750 / 1M $1.000 / 1M
??? ?? ???? $14.000 / 1M $3.000 / 1M
آؤٹ پٹ ٹوکنز 2,309 2,790
ریزننگ ٹوکنز 36,880 52,001
ردِعمل کا وقت (اوسط) 15.33s 16.23s
ردِعمل کا وقت (زیادہ سے زیادہ) 100.93s 84.22s
ردِعمل کا وقت (کل) 291.34s 292.10s

اسکور کے لحاظ سے سرفہرست ماڈلز

اسکور بمقابلہ کل لاگت

ردِعمل کا وقت (اوسط)

اسکور vs ردِعمل کا وقت (اوسط)

کل آؤٹ پٹ ٹوکنز

اسکور vs کل آؤٹ پٹ ٹوکنز

زمرہ وار تفصیل

اینٹی اے آئی چالیں اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.3-Codex 8.7 7.9 91.7% 1 4.16s 240 1,722
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 3.26s 323 1,179
کوڈنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.3-Codex 10.0 10.0 100.0% 0 8.95s 491 1,530
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 32.58s 543 7,485
مشترکہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.3-Codex 10.0 10.0 100.0% 0 19.56s 364 2,731
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 53.36s 348 11,870
ڈیٹا پارسنگ اور استخراج اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.3-Codex 10.0 10.0 100.0% 0 3.07s 234 728
MiMo-V2.5-Pro 7.3 5.8 83.3% 1 18.81s 260 8,383
ڈومین مخصوص اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.3-Codex 5.9 7.2 55.6% 1 64.31s 64 25,308
MiMo-V2.5-Pro 5.3 10.0 33.3% 0 37.87s 275 17,023
عمومی ذہانت اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.3-Codex 4.6 10.0 0.0% 0 4.87s 187 331
MiMo-V2.5-Pro 5.5 10.0 0.0% 0 4.02s 155 163
ہدایات کی پیروی اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.3-Codex 10.0 10.0 100.0% 0 3.04s 93 693
MiMo-V2.5-Pro 9.9 10.0 100.0% 0 2.77s 82 803
پہیلی حل کرنا اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.3-Codex 9.0 7.9 88.9% 1 5.12s 352 1,644
MiMo-V2.5-Pro 6.7 7.9 55.6% 1 5.16s 493 2,187
ٹول کالنگ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.3-Codex 10.0 10.0 100.0% 0 6.37s 254 492
MiMo-V2.5-Pro 10.0 10.0 100.0% 0 16.87s 311 2,908
معلومات عامہ اسکور تسلسل فی کوشش کامیابی کی شرح غیر مستحکم ٹیسٹ درست ٹیسٹس ردِعمل کا وقت (اوسط) آؤٹ پٹ ٹوکنز ریزننگ ٹوکنز
GPT-5.3-Codex 2.8 1.6 33.3% 1 14.43s 30 1,701
MiMo-V2.5-Pro - - - - - - - -

فوری موازنہ

موازنہ کی جوڑی تبدیل کریں